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NOUVELLE PROTEINE ASSOCIEE AUX CENTROSOMES ET SES 

APPLICATIONS. 

La presente Invention est relative a une nouvelle proteine 
associee aux centrosomes, au polynucleotide codant pour ladite proteine ainsi 
5 qu'aux applications de ladite proteine et dudit polynucleotide. 

Le processus de division cellulaire consiste en une division 
nucleaire (mitose) suivie d'une division cytoplasmique (cytokinese). La mitose 
est dominee par la formation d'un fuseau polaire tres organise (le fuseau 
mitotique) constitu6 de deux families de microtubules : les microtubules 
10 polaires et les microtubules kinetochoriens. Les microtubules sont des poly- 
meres composes de sous-unites d'a- et p-tubuline. Leur croissance est initiee 
dans la region peripherique du centrosome par un complexe contenant majo- 
ritairement une proteine apparentee, la Y-tubuline. Les microtubules polaires 
sont composes de rangees de microtubules et de proteines associees qui 
15 sont mises en place par les deux centres mitotiques, associes a des 
centrioles, situes aux poles opposes du fuseau (asters). Chaque chromosome 
replique est constitue de deux chromatides soeurs reliees entre elles par le 
centromere. Les microtubules kinetochoriens sont lies aux chromosomes 
repliques par des structures specialisees appelees kinetochores qui se 
20 forment au cours de la prophase sur chacune des deux faces du centromere. 
Les chromosomes se condensent pendant la prophase et forment les micro- 
tubules kinetochoriens qui commencent a interagir avec les microtubules 
polaires du fuseau apres rupture de I'enveloppe nucleaire au cours de la 
prometaphase. Sous I'effet de la tension due aux forces opposees, dirigees 
25 vers les pdles qui tirent les microtubules kinetochoriens, les chromosomes 
s'alignent dans la zone equatoriale du fuseau pendant la metaphase. A I'ana- 
phase, sous I'effet de forces continuellement developpees au sein du fuseau 
mitotique, les chromatides soeurs se detachent et sont attirees vers les p6les 
opposes. Dans le meme temps, les deux poles cellulaires s'ecartent. Au cours 
30 de la telophase, I'enveloppe nucleaire se reforme a la surface de chaque 
groupe de chromosomes. 
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La division cellulaire s'acheve au moment ou le contenu cyto- 
plasmique est divise selon le processus de cytokinese. Le fuseau mitotique 
joue un role important dans le processus de cytokinese, en fixant la mise en 
place de la segmentation cellulaire. Le sillon de division apparatt invariable- 
5 ment dans le plan de la plaque equatoriale, perpendiculairement a I'axe du 
fuseau mitotique. 

Les processus decrits ci-dessus sont finement regul6s par un 
6quilibre entre des reactions de phosphorylation et de d6phosphorylation. 
Lorsque la cellule entre en mitose, des changements importants dans la 

10 phosphorylation des proteines interviennent. Le centrosome et le fuseau 
mitotique sont particulierement enrichis en sites phosphoryles. De 
nombreuses proteine-kinases, particulierement des serine-threonine-kinases, 
ont 6t6 decrites comme intervenant dans ces processus de phosphorylation 
(voir a cet egard Giet R. et Prigent C., J. Cell Science, 112, 3591-3601, 1999). 

15 Parmi celles-ci on citera celles localisees au niveau des centrosomes, parmi 
lesquelles les kinases de type aurora, requises pour la separation des centro- 
somes et Tassemblage du fuseau mitotique, les kinases de type polo, impli- 
quees dans la maturation et la formation du fuseau bipolaire et les kinases de 
type NIMA qui regulent la separation des centrosomes. 

20 Les mammiferes possedent au moins trois proteine-kinases 

du type aurora. Chez I'homme, ces trois proteine-kinases sont surexprimees 
dans des pathologies cancereuses du fait d'anomalies chromosomiques. 
Ainsi, ces proteines semblent jouer un role important dans le controle de la 
ploYdie, Par exemple, une inactivation ou une surexpression de deux de ces 

25 kinases conduit & une polyplo'fdie. ^inhibition de Tactivite de la kinase aurora 
A conduit a la formation de fuseaux monopolaires. ^inhibition de Tactivite de 
la kinase aurora B conduit & la formation de cellules multinucleees par d§faut 
de cytokinese. Ces anomalies chromosomiques apparaissent liees & des 
perturbations dans la formation du fuseau mitotique. 

30 Les partenaires et les substrats de ces proteine-kinases sont 

encore peu connus. Par exemple, chez le x§nope, aurora A interagit avec une 
kin6sine impliquee dans la dynamique des microtubules. Chez Thomme, elle 
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phosphoryle la proteine HsTACC-3, egalement surexprim6e dans de 
nombreuses lignees de cellules cancereuses. Chez la drosophile, aurora A 
phosphoryle la proteine D-TACC et est necessaire a sa localisation aux 
centrosomes afin de r6guler les microtubules astraux. D-TACC interagit avec 

5 la proteine associee aux microtubules (MAP : Microtubule Associated Protein) 
Msp, qui fait partie de la famille des proteines XMA0215/ch-TOC/Msps f qui 
stimulent la croissance des microtubules in vitro et sont concentrees au 
niveau des centrosomes in vivo. D-TACC et Msp coop&rent pour stabiliser les 
centrosomes. Le terme MAP regroupe une collection de proteines varices 

10 definies sur la base de leur capacite a interagir avec les microtubules. Les 
MAP apparaissent comme des partenaires/substrats des kinases du centro- 
some comme aurora ou polo. 

Une division cellulaire correcte necessite une coordination 
entre la segregation des chromosomes par le fuseau mitotique et le clivage de 

15 la cellule par Pappareil de cytokinese. Les microtubules du fuseau mitotique 
jouent un role essentiel dans les deux processus. 

Cependant, malgre I'ensemble des travaux realises sur la 
division cellulaire, les facteurs intervenant dans une mise en place correcte du 
fuseau mitotique et/ou au contraire perturbant sa mise en place et/ou sa 

20 structure, entraTnant ainsi les consequences ci-dessus decrites ne sont 
toujours pas connus. 

Une telle connaissance permettrait d'une part de mieux 
comprendre les mecanismes de la mitose et d'autre part de pouvoir develop- 
per des moyens de lutter contre les anomalies de la division cellulaire et les 

25 consequences qu'elles entrament. 

C'est dans ce domaine que se place la pr£sente Invention. 
En effet, de maniere surprenante et inattendue, les Inventeurs 
ont mis en evidence une nouvelle proteine humaine associee aux centro- 
somes. Par immunofluorescence, elle est detectee en colocalisation avec Toc- 

30 tubuline des microtubules du fuseau mitotique, en particulier avec Taster. 
Cette proteine a 6t6 nomm6e ASAP pour Aster Associated Protein (Proteine 
Associee & TAster) par les Inventeurs. 
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La surexpression de la proteine selon I'lnvention entralne des 
perturbations dans I'organisation du fuseau mitotique et induit des mitoses 
aberrantes et abortives (cellules plurinucleees, fuseaux mono- ou multi- 
polaires). Sa surexpression bloque la division cellulaire et par cons6quent la 
5 proliferation cellulaire. 

Ainsi, Nnvention a pour objet une proteine isotee, d6nommee 
ASAP, caracterisee en ce qu'elle est selectionnee dans le groupe constitue 
par : 

a) une proteine repondant a la sequence representee dans la 
10 liste de sequences en annexe sous le numero SEQ ID NO: 1 ; 

b) une proteine presentant, sur la totalite de sa sequence, au 
moins 80% d'identite ou au moins 90% de similarity de preference au moins 
90 % d'identite ou au moins 95% de similarity avec la proteine de SEQ ID 
NO: 1. 

15 Une proteine conforme a I'lnvention se caracterise par les 

proprietes suivantes : 

elle presente un poids moleculaire compris entre 60 et 
100 kDa, de preference entre 65 et 80 kDa ; 

elle est associ6e aux centrosomes ; 
20 - elle est colocalisee par immunofluorescence avec 

Ta-tubuline des microtubules du fuseau mitotique ; 

elle presente une faible identite (23%) avec la proteine 
MAPI A (Microtubule Associated Protein 1A) ; 

elle presente des domaines coiled-coil essentiellement 
25 regroupes dans sa partie C-terminale entre les acides amines 297 et 327 
d'une part et 477 et 628 d'autre part, indiquant soit que la proteine s'oligo- 
merise, soit qu'elle interagit avec d'autres prolines ; 

elle presente une faible identit6 (20%), entre les acides 
amines 300 et 600 avec un domaine de type caldesmon (Gusev, N.B., 
30 Biochemistry, 10 : 1112-1121, 2000), r6ferenc6 pfam00769 (NCBI, domains, 
http://www.ncbi. nlm.nih.gov/Structure/cdd/cddsrv.cgi?uid=pfam00769), et, 
entre les acides amines 480 et 630, avec un domaine de type ERM 
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(Ezrin/radixin/moesin ; Louvet-Vallet, S., Biol. Cell, 274 : 305-316, 2000), refe- 
rence pfam02029 (NCBI, domains, http://\AWW.ncbi.nlm.nih.gov/Structure/ 
cdd/cddsrv.cgi?uid=pfam02029). Les proteines caldesmon et ERM sont egale- 
ment considerees comme des MAP ; 

5 - elle presente egalement, entre les positions 65 et 303, un 

domaine BRCT, (Breast cancer carboxy-terminal domain ; Bork, P., et coll., 
FASEB J., 11, 68-76 (1997)), indiquant que la proteine est impliquee dans le 
controle du cycle cellulaire 1 ; 

elle presente une grande richesse en helices a dans sa 

10 partie C-terminale, en particulier dans la region comprise entre les acides 
amines 420-620, presque exclusivement form6e d'heiices a. 

Ces Elements permettent de penser que la proteine ASAP est 
une nouvelle MAP. 

Les proteines selon Nnvention incluent toute proteine (natu- 

15 relle, synthetique, semi-synthetique ou recombinante) de n'importe quel orga- 
nisme procaryote ou eucaryote, notamment d f un mammifere, comprenant ou 
consistant en une proteine ASAP. Preferentiellement, ladite proteine est une 
proteine ASAP fonctionnelle. 

On entend par "fonctionnelle", une proteine possedant une 

20 activite biologique normale, c'est a dire capable d'intervenir dans 
I'organisation du fuseau mitotique et dans la division cellulaire. Cette proteine 
peut comprendre des mutations silencieuses n'induisant aucun changement 
substantiel dans son activite et ne produisant aucune modification pheno- 
typique. 

25 Des proteines conformes & Tinvention sont notamment repre- 

sentees par les proteines ASAP humaine (SEQ ID NO : 1) et murine (SEQ ID 
NO : 46). 

Sont incluses dans les proteines selon Tlnvention d6finies en 
b), les proteines variantes des sequences SEQ ID NO: 1 et 46, en particulier 
30 les proteines dont la sequence en acides amines presente au moins une 
mutation correspondant notamment £ une troncation, une d§!6tion f une 
substitution et/ou une addition d f au moins un residu d'acide amine par rapport 
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aux sequences SEQ ID NO: 1 et 46. 

De maniere pr6feree, les proteines variantes presentent une 
mutation entraTnant un dysfonctionnement (activation ou inhibition) de la 
proteine, d'autres g6nes ou proteines ou encore de la cellule en g6n6ral. 
5 Selon un autre mode de realisation avantageux de Nnvention, 

ladite proteine est une proteine de mammifere, preferentiellement une 
proteine d'origine humaine. 

Au sens de la presente Invention les definitions suivantes 

s'appliquent. 

10 Uidentite d'une sequence par rapport & la sequence de SEQ 

ID NO :1 comme sequence de reference s'apprecie en fonction du pourcen- 
tage de r6sidus d'acides amines qui sont identiques, lorsque les deux 
sequences sont alignees, de maniere a obtenir le maximum de corres- 
pondance entre elles. 

15 Le pourcentage d'identite peut etre calcule par I'Homme du 

metier en utilisant un programme informatique de comparaison de sequences 
tel que, par exemple celui de la suite BLAST (Altschul et al., NAR, 1997, 25, 
3389-3402). 

Les programmes BLAST sont mis en oeuvre sur la fenetre de 
20 comparaison constitute par la totalite de la SEQ ID NO :1, indiquee comme 
sequence de reference. 

Une proteine ayant une sequence en acides amines ayant au 
moins X % d'identite avec une sequence de reference est definie, dans la 
presente Invention comme une proteine dont la sequence peut inclure jusqu'a 
25 100-X alterations pour 100 acides amines de la sequence de reference, tout 
en conservant les proprietes fonctionnelles de ladite proteine de reference. Au 
sens de la presente Invention, le terme alteration inclut les deletions, les 
substitutions ou les insertions cons£cutives ou disperstes d'acides amines 
dans la sequence de reference. 
30 La similarite d'une sequence par rapport a une sequence de 

reference s'apptecie en fonction du pourcentage de r6sidus d'acides amines 
qui sont identiques ou qui different par des substitutions conservatives, 
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lorsque les deux sequences sont align6es de maniere a obtenir le maximum 
de correspondance entre elles. Au sens de la presente Invention, on entend 
par substitution conservative, la substitution d'un acide amine par un autre qui 
presente des proprtetes chimiques ou physiques similaires (taille, charge ou 
5 polarite), qui generalement ne modifie pas les proprtetes fonctionnelles de la 
proteine. 

Une proteine ayant une sequence en acides amines ayant au 
moins X % de similarity avec une sequence de reference est d6finie, dans la 
presente Invention comme une proteine dont la sequence peut inclure jusqu'a 
10 100-X alterations non-conservatives pour 100 acides amines de la sequence 
de reference. Au sens de la presente Invention, le terme alterations non- 
conservatives inclut les deletions, les substitutions non-conservatives ou les 
insertions consecutives ou dispersees d'acides amines dans la sequence de 
reference. 

15 Par "techniques ou methodes bien connues de Thomme du 

metier" on entend ici se referer aux techniques ou methodes classiquement 
utilisees par I'homme du metier et expos6es dans de nombreux ouvrages, 
comme en particulier celui intitule Molecular Cloning. A Laboratory Manual 
(Sambrook J, Russell DW. (2000) Cold Spring Harbor Laboratory Press). 

20 La proline selon Nnvention est obtenue soit & partir d'une 

cellule, soit par synthase chimique, soit par recombinaison genetique. 

Par synthese chimique, la proteine peut etre obtenue en utili- 
sant Tune des nombreuses voies de syntheses peptidiques connues, par 
exemple les techniques mettant en oeuvre des phases solides ou des 

25 techniques utilisant des phases solides partielles, par condensation de frag- 
ments ou par une synthase en solution classique. Dans ce cas, la sequence 
de la proteine peut §tre modiftee afin d'ameliorer sa solubility, en particulier 
dans les solvants aqueux. De telles modifications sont connues de I'homme 
du metier comme par exemple la deletion de domaines hydrophobes ou la 

30 substitution d'acides amines hydrophobes par des acides amines hydrophiles. 

La proteine selon Nnvention est constitute de TenchaTnement 
de 13 peptides correspondants aux produits de traduction de 13 des 14 exons 
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que comporte le gene correspondant, le premier exon n'etant pas traduit (voir 
ci-apres). 

De maniere plus precise, lesdits peptides repondent aux 
sequences suivantes (positions donnees par rapport a la numerotation de la 
5 sequence SEQ ID NO: 1) : 

- Peptide 1 : il comprend 25 acides amines correspondants 
aux positions 1 a 25 (SEQ ID NO: 2) ; 

- Peptide 2 : il comprend 28 acides amines correspondants 
aux positions 26 a 53 (SEQ ID NO: 3) ; 

10 - Peptide 3 : il comprend 107 acides amines correspondants 

aux positions 54 a 160 (SEQ ID NO: 4) ; 

- Peptide 4 : il comprend 76 acides amines correspondants 
aux positions 161 a 236 (SEQ ID NO: 5) ; 

- Peptide 5 : il comprend 31 acides amines correspondants 
15 aux positions 237 a 267 (SEQ ID NO: 6) ; 

- Peptide 6 : il comprend 83 acides amines correspondants 
aux positions 268 a 350 (SEQ ID NO: 7) ; 

- Peptide 7 : il comprend 24 acides amines correspondants 
aux positions 351 a 374 (SEQ ID NO: 8) ; 

20 - Peptide 8 : il comprend 54 acides amines correspondants 

aux positions 375 a 428 (SEQ ID NO: 9) ; 

- Peptide 9 : il comprend 32 acides amines correspondants 
aux positions 429 a 460 (SEQ ID NO: 10) ; 

- Peptide 10 : il comprend 54 acides amines correspondants 
25 aux positions 461 a 514 (SEQ ID NO: 1 1) ; 

- Peptide 11 : il comprend 49 acides amines correspondants 
aux positions 51 5 a 563 (SEQ ID NO: 12); 

- Peptide 12 : il comprend 43 acides amines correspondants 
aux positions 564 a 606 (SEQ ID NO: 13) ; 

30 - Peptide 13 : il comprend 41 acides amines correspondants 

aux positions 607a 647 (SEQ ID NO: 14). 
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La presente Invention a aussi pour objet un peptide constitu6 
d'un fragment d'au moins 10 acides amines consecutifs d'une proteine definie 
ci-dessus en a) ou b), particulierement un peptide selectionne parmi : 

- les sequences correspondant aux peptides 1 a 13 decrits ci- 
5 dessus, c'est-&-dire s§lectionne parmi les sequences SEQ ID NO: 2 a SEQ ID 
NO: 14, et 

- les sequences SEQ ID NO : 47 a 53 correspondant a des 
mutants de la proteine hASAP d§l6tes de la partie N-terminale contenant le 
domaine BRCT (NdeM : residus 304 -647 (SEQ ID NO: 48) ; Ndel2 : n§sidus 
10 41 1-647 (SEQ ID NO : 49) ; Ndel3 : residus 478-647 (SEQ ID NO : 50)) ou de 
la partie C-terminale contenant le domaine MAP (CdeH : residus 1 & 477 
(SEQ ID NO: 51) ; Cdel2 : r6sidus 1 a 418 (SEQ ID NO: 52) ; Cdel3 : r§sidus 
1 a 303 (SEQ ID NO: 53) ; residus 1 a 421 (SEQ ID NO: 47)). 

Selon un mode de realisation avantageux de Nnvention, ledit 
15 peptide est utile pour la production d'anticorps reconnaissant specifiquement 
une proteine telle que d6finie ci-dessus, preferentiellement reconnaissant la 
proteine ASAP de sequence SEQ ID NO: 1 ou SEQ ID NO: 46. 

^Invention a ainsi egalement pour objet des anticorps mono- 
clonaux ou polyclonaux, caracterises en ce qu'ils sont capables de 
20 reconnaitre specifiquement une proteine selon Tlnvention. 

De manure preferentielle selon Nnvention, les anticorps 
reconnaissent, parmi les MAPs, uniquement et specifiquement la proteine 
ASAP de sequence SEQ ID NO: 1 ou SEQ ID NO: 46. 

Les anticorps selon Nnvention sont, par exemple, des anti- 
25 corps chimeriques, des anticorps humanises, des fragments Fab ou F(ab')2. 
lis peuvent egalement se presenter sous forme d'immunoconjugufes ou d'anti- 
corps marques afin d'obtenir un signal delectable et/ou quantifiable. 

Lesdits anticorps peuvent etre obtenus directement & partir de 
serum humain pu & partir de s6rum d'animaux immunises avec les proteines 
30 ou les peptides selon Nnvention. Les anticorps polyclonaux ou monoclonaux 
sp6cifiques peuvent etre obtenus selon les techniques bien connues de 
THomme du Metier. 
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^Invention a egalement pour objet Tutilisation des anticorps 
selon Tlnvention pour la detection et/ou la purification d'une proteine selon 
Tlnvention. 

De maniere generate, les anticorps selon Tlnvention peuvent 

5 etre avantageusement utilises pour detecter la presence d'une proteine selon 
Tlnvention, normale ou mutee. 

Particulterement, les anticorps monoclonaux, peuvent etre uti- 
lises pour la detection de ces proteines dans un 6chantillon bioiogique. lis 
constituent ainsi un moyen d'analyse immunocytochimique ou immuno- 

10 histochimique de Texpression des proteines selon Tlnvention, notamment la 
proteine de sequence SEQ ID NO: 1, sur des coupes de tissus. Gen6ralement 
pour de telles analyses, les anticorps utilises sont marques afin d'etre detec- 
tables par exemple par des composes immunofluorescents, par marquage & 
Tor ou sous forme d'immunoconjugu6s enzymatiques. 

15 lis peuvent permettre notamment de mettre en evidence une 

expression anormale de ces proteines dans les tissus ou pretevements 
biologiques et ainsi permettre la detection de cellules presentant des pertur- 
bations dans Torganisation du fuseau mitotique et/ou une induction des 
mitoses aberrantes et abortives (cellules plurinucteees, fuseaux mono- ou 

20 multipolaires) liees a la surexpression de la proteine selon Tlnvention. 

^Invention a egalement pour objet une methode de detection 
dans un echantillon bioiogique de la proteine selon Tlnvention, particuliere- 
ment de la proteine ASAP, comprenant une premiere etape de traitement 
convenable des cellules par tout moyen approprte permettant de rendre 

25 accessible le milieu intracellular, une seconde etape de mise en contact 
dudit milieu intracellular ainsi obtenu avec un anticorps selon Tlnvention et 
une troisieme etape de mise en evidence par tout moyen approprte du 
complexe proteine ASAP-anticorps fornrte. 

Cette nrtethode peut en outre permettre de mesurer le taux 

30 depression de la proteine selon Tlnvention dans des cellules, particulfere- 
ment dans des cellules canc6reuses. U6tude de Texpression de la proteine 
ASAP (sur- ou sous-expression) est un element devaluation de la capacite de 
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proliferation ou d'agressivite (capacite a evoluer vers des cancers de mauvais 
pronostic) de cellules cancereuses. 

[.'Invention a done egalement pour objet une methode d'eva- 
luation in vitro de la capacite de proliferation ou d'agressivite des cellules 

5 cancereuses contenues dans un echantillon biologique, caracterisee en ce 
qu'elle comprend une premiere etape de traitement convenable des cellules 
par tout moyen approprie permettant de rendre accessible le milieu intra- 
cellulaire, une seconde etape de mise en contact dudit milieu intracellulaire 
ainsi obtenu avec un anticorps selon I'lnvention, une troisieme etape de mise 

10 en evidence et/ou de mesure par tout moyen approprie du complexe proteine 
ASAP-anticorps forme et une quatrieme etape devaluation du taux de 
transcription du gene par comparaison du taux de complexes proteine 
ASAP-anticorps formes a celui d'un echantillon biologique temoin prealable- 
ment choisi. Ledit temoin peut etre constitue par exemple par un echantillon 

15 biologique contenant des cellules presentant un taux de proteines normal ou 
altere, auquel ladite methode est appliquee dans les memes conditions. 

L'lnvention a egalement pour objet une trousse permettant de 
mettre en ceuvre Tune quelconque des methodes ci-dessus decrites compre- 
nant : 

20 a) au moins un anticorps monoclonal ou polyclonal selon 

l'lnvention ; 

b) les reactifs permettant la detection du complexe proteine 
ASAP-anticorps produit lors de la reaction immunologique. 

Selon un mode de realisation particulier de l'lnvention, la 
25 trousse peut eventuellement comprendre des reactifs necessaires pour rendre 
accessible le milieu intracellulaire. 

Par moyen pour rendre accessible le milieu intracellulaire, on 
entend tout moyen connu de I'Homme du Metier comme par exemple la lyse 
cellulaire par voie enzymatique, chimique ou encore la sonication, la perm§a- 
30 tion membranaire, les chocs thermiques. 
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La presente Invention a 6galement pour objet un poly- 
nucleotide isoie (ADNc ou fragment d'ADN genomique), caracterise en ce que 
sa sequence est selectionnee dans le groupe constitue par : 

les sequences codant pour une proteine ou un peptide 
5 tels que definis ci-dessus, et 

les sequences complementaires des precedentes, sens 

ou anti-sens. 

^Invention englobe, les alleles du gene asap issus de 
n'importe quel mammifere, ainsi que les polynucleotides des mutants naturels 

10 ou artificiels du gene asap codant pour une proteine ASAP, particuli&rement 
pour une proteine ASAP fonctionnelle telle que definie ci-dessus. 

Selon un mode de realisation avantageux de I'lnvention, ledit 
polynucleotide codant pour une proteine ASAP repond & une sequence selec- 
tionnee dans le groupe constitue par : 

15 - la sequence SEQ ID NO: 15, correspondant a I'ADN 

complementaire de 2575 nucleotides de I'ARNm codant pour la proteine 
ASAP humaine (hASAP) ; 

- la sequence SEQ ID NO: 45, correspondant & I'ADN 
complementaire de 2767 nucleotides de PARNm codant pour la proteine 

20 ASAP murine (mASAP) 

le fragment d'ADN genomique de 29750 nucleotides 
r6pondant a la sequence representee dans la liste des sequences en annexe 
sous le numero SEQ ID NO: 16, correspondant au gene asap humain 
comprenant 14 exons dont 13 seulement sont traduits, le premier exon n'etant 

25 pas traduit, contenue dans le contig AC097467 (longueur 178204 paires de 
bases) entre les bases 115117 et 143828 (version v.7.29a3 NCBI/Ensembl du 
12 juillet 2002, http://w\Aw.ensembl.org), par ailleurs localisee sur le 
chromosome 4q32.1 entre les marqueurs anonymes D4S1053 et D4S571 
(region 161,25 Megabases (Mb) S 161,28 Mb). 

30 La sequence SEQ ID NO: 16 est contenue dans le clone BAC 

RP11-27G13 (Osoegawa, K., et col., (2001) A Bacterial Artificial Chromosome 
Library for Sequencing the Complete Human Genome, Genome Research, 
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Vol. 11, n°3, 483-496, mars 2001). Les sequences contenues dans le contig 
AC097467 et dans le clone BAC RP1 1-27G13 ont ete obtenues dans le cadre 
du programme de sequencage du genome humain et n'ont jusqu'a present fait 
I'objet d'aucune reconnaissance ni caracterisation precises permettant de leur 

5 attribuer une quelconque fonction. Deux acides nucleiques correspondants a 
des fragments du polynucleotide isole par les Inventeurs sont repertories dans 
la base de donnees GenBank sous les numeros d'acces AK024730 et 
AK024812, ainsi que les EST repertories sous les numeros d'acces 
BU198882, BM693711, AW372449, BM021380, BU928828, AL707573, 

10 AI885274, AI671785, AA805679, BU619959, BM021126, AL598336, 
AW976973, BU629726, AI433877, AV751613, BQ372751, AI827535, 
AI866257, AA843565, R96130, BU684090, BF958121, BQ351941, 
AW1 94906, BG203580, BF078132, AW486134, AL600279, AA025538, 
AL600264, BF170676, BU759494, BB025236, BF214179, AI283076, 

15 BE694273, AI266380, BM670854, AA968415, BU503982, BB700612, 
BE988355, BU058357, BB312934, AW061311, BM537962, BE988356, 
BB318982, BB311217, BB557152, BB185248, BB557128, BB698742, 
BB1 86736, AV345769, BB274293, BB632007, BB617958, AI391312, 
W18534, BB1 86581, BB311289, BB312835, AW347411, AA972439, 

20 BB263570, AU035125, BB277226, BB274224, BB268445, AW024037, 
AA025609, BB274174, R96089, BB272238, BB269037, BB385718, 
BE007324, BB325992, AJ275277, AI414381, BB125476, BB430961, 
BE232162, BQ121419, BQ121418, BG591509, BF457670, AL897593, 
AL897592, BM926692, BM538559, BI759567, AL601021, AL598780, 

25 AU222540, BG567619, AU166296, BF889835, AU164011, AV656025, 
BF343454, AW262441, AW237952. Ces sequences, obtenues dans le cadre 
d'un programme de sequencage en masse de banques d'ADN complemen- 
taires humains, sont incompletes et n'ont jamais ete ni reconnues ni caracteri- 
sees. En fait, le polynucleotide isole par les Inventeurs presente de longs 

30 enchatnements de desoxyadenosines (poly-dA), ce qui explique les difficultes 
rencontrees par les Inventeurs pour obtenir I'ADNc complet par utilisation 
d'amorces oligo-desoxythymidines (oligo-dT) classiques, celles-ci s'hybridant 
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de mani&re aleatoire avec les enchainements poly-dA. C'est par I'utilisation 
repetee de la technique de l f amplification rapide des extremites 3' d'ADNc (3' 
Rapid Amplification cDNA end ou 3'RACE) que les Inventeurs sont parvenus 
a isoler le polynucl6otide correspondant & I'ARNm complet. 
5 L'ARNm, correspondant au polynucleotide de sequence SEQ 

ID NO: 15, est specifiquement exprime dans le testicule sous la forme d'un 
polynucleotide d'une longueur d'environ 2,9 kilobases et dans le cerveau sous 
la forme d f un polynucleotide d'une longueur d'environ 9 kilobases pouvant 
correspondre soit a un premessager soit a une isoforme de haut poids mole- 
10 culaire. 

De manfere plus pr6cise, lesdits exons sont repartis comme 
suit sur ladite sequence genomique (par rapport a la numerotation de la 
sequence SEQ ID NO: 16) : 

- exon 1 : il comprend 200 paires de bases correspondant aux 
15 positions 101 a 300 (SEQ ID NO: 17) ; 

- exon 2 : il comprend 139 paires de bases correspondant aux 
positions 1157 a 1295 (SEQ ID NO: 18) ; 

- exon 3 : il comprend 85 paires de bases correspondant aux posi- 
tions 2050 £ 2134 (SEQ ID NO: 19) ; 

20 - exon 4 : il comprend 321 paires de bases correspondant aux 

positions 3615 a 3935 (SEQ ID NO: 20) ; 

- exon 5 : il comprend 227 paires de bases correspondant aux 
positions 8259 a 8485 (SEQ ID NO: 21) ; 

- exon 6 : il comprend 94 paires de bases correspondant aux posi- 
25 tions 14930 a 15023 (SEQ ID NO: 22) ; 

- exon 7 : il comprend 248 paires de bases correspondant aux 
positions 16715 a 16962 (SEQ ID NO: 23) ; 

- exon 8 : il comprend 71 paires de bases correspondant aux posi- 
. tions. 19552 £ 19622 (SEQ ID NO: 24) ; 

30 - exon 9 : il comprend 169 paires de bases correspondant aux 

positions 21187 a 21355 (SEQ ID NO: 25) ; 
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- exon 10 : il comprend 90 paires de bases correspondant aux 
positions 2191 1 a 22000 (SEQ ID NO: 26) ; 

- exon 11 : il comprend 162 paires de bases correspondant aux 
positions 23731 a 23892 (SEQ ID NO: 27) ; 

5 - exon 12 : il comprend 146 paires de bases correspondant aux 

positions 24014 a 24159 (SEQ ID NO: 28) ; 

- exon 13 : il comprend 133 paires de bases correspondant aux 
positions 24343 a 24475 (SEQ ID NO: 29) ; 

- exon 14 : il comprend 485 paires de bases correspondant aux 
10 positions 29166 a 29650 (SEQ ID NO: 30). 

L' Invention a aussi pour objet : 

un fragment de I'un quelconque des polynucleotides selon 
I'lnvention, d'au moins 15 a 1500 nucleotides consecutifs a I'exclusion des 
sequences repertoriees sous les numeros d'acces AK024730 et AK024812 et 

15 des EST repertories sous les numeros d'acces BU1 98882, BM693711, 
AW372449, BM021380, BU928828, AL707573, AI885274, AI671785, 
AA805679, BU619959, BM021126, AL598336, AW976973, BU629726, 
AI433877, AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, 
BU684090, BF958121, BQ351941, AW1 94906, BG203580, BF078132, 

20 AW486134, AL600279, AA025538, AL600264, BF1 70676, BU759494, 
BB025236, BF214179, AI283076, BE694273, AI266380, BM670854, 
AA968415, BU503982, BB700612, BE988355, BU058357, BB312934, 
AW061311, BM537962, BE988356, BB318982, BB311217, BB557152, 
BB1 85248, BB557128, BB698742, BB1 86736, AV345769, BB274293, 

25 BB632007, BB617958, AI391312, W18534, BB186581, BB311289, 
BB312835, AW347411, AA972439, BB263570, AU035125, BB277226, 
BB274224, BB268445, AW024037, AA025609, BB274174, R96089, 
BB272238, BB269037, BB385718, BE007324, BB325992, AJ275277, 
AI414381, BB125476, BB430961, BE232162, BQ121419, BQ121418, 

30 BG591509, BF457670, AL897593, AL897592, BM926692, BM538559, 
BI759567, AL601021, AL598780, AU222540, BG567619, AU166296, 
BF889835, AU164011, AV656025, BF343454, AW262441, AW237952 dans 
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la base de donn6es GenBank, particulierement un fragment seiectionne parmi 
les sequences correspondants aux exons c'est-a-dire s6lectionne parmi les 
sequences SEQ ID NO: 16 & SEQ ID NO: 30 ; 

un acide nucleique presentant un pourcentage d'identite 
5 d'au moins 80 %, de preference d'au moins 90 %, avec I'un des poly- 
nucleotides selon Tlnvention. 

La definition de Tidentite d'une sequence donnee prec6dem- 
ment pour les proteines, s'applique par analogie aux molecules d'acide 
nucleique. 

10 Sont inclus dans un polynucleotide pr6sentant un pourcentage 

d'identite d'au moins 80 %, de preference au moins 90 %, selon Tlnvention, 
les polynucleotides variants des sequences SEQ ID NO: 15 et 45, c'est-a-dire 
I'ensemble des polynucleotides correspondants a des variants alieiiques, 
c'est-a-dire a des variations individuelles des sequences SEQ ID NO: 15 et 

15 45. Ces sequences variantes naturelles correspondent a des polymorphismes 
presents chez les mammiferes, en particulier chez I'etre humain et, notam- 
ment ^ des polymorphismes pouvant conduire & la survenue d'une pathologie. 

On entend egalement designer par polynucleotide variant, tout 
ARN ou ADNc resultant d'une mutation et/ou d'une variation d'un site 

20 d'epissage de la sequence genomique dont TARNm a comme ADN compie- 
mentaire le polynucleotide de sequence SEQ ID NO: 15 ou SEQ ID NO : 45. 

De preference, la presente Invention concerne les poly- 
nucleotides ou les fragments variants des sequences SEQ ID NO: 15 et 45, 
particulierement ceux dans lesquelles les mutations conduisent a une modifi- 

25 cation de la sequence en acides amines des proteines de sequence SEQ ID 
NO: 1 et SEQ ID NO : 46. 

Les polynucleotides selon Tlnvention peuvent etre isol6s £ 
partir de cellules, particulierement des cellules de testicule ou de cerveau ou a 
partir de banques d ! ADN cellulaire.. lis peuvent egalement etre obtenus par 

30 une reaction de polymerisation en chaine (PCR) effectu6e sur TADN total des 
cellules ou encore par RT-PCR effectuee sur les ARN totaux des cellules ou 
par synthese chimique. 
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Les polynucleotides selon Nnvention, particulierement les 
fragments de I'un quelconque des polynucleotides selon I'lnvention, et les 
sequences repertories sous les numeros d'acces AK024730 et AK024812 et 
les EST repertories sous les numeros d'acces BU1 98882, BM693711, 
5 AW372449, BM021380, BU928828, AL707573, AI885274, AI671785, 
AA805679, BU619959, BM021126, AL598336, AW976973, BU629726, 
AI433877, AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, 
BU684090, BF958121, BQ351941, AW1 94906, BG203580, BF078132, 
AW486134, AL600279, AA025538, AL600264, BF1 70676, BU759494, 

10 BB025236, BF214179, AI283076, BE694273, AI266380, BM670854, 
AA968415, BU503982, BB700612, BE988355, BU058357, BB312934, 
AW061311, BM537962, BE988356, BB318982, BB311217, BB557152, 
BB1 85248, BB557128, BB698742, BB1 86736, AV345769, BB274293, 
BB632007, BB617958, AI391312, W18534, BB1 86581, BB311289, 

15 BB312835, AW347411, AA972439, BB263570, AU035125, BB277226, 
BB274224, BB268445, AW024037, AA025609, BB274174, R96089, 
BB272238, BB269037, BB385718, BE007324, BB325992, AJ275277, 
AI414381, BB125476, BB430961, BE232162, BQ121419, BQ121418, 
BG591509, BF457670, AL897593, AL897592, BM926692, BM538559, 

20 BI759567, AL601021, AL598780, AU222540, BG567619, AU166296, 
BF889835, AU164011, AV656025, BF343454, AW262441, AW237952 dans 
la base de donn6es Gen Bank ou leurs fragments, peuvent notamment etre 
utilises comme sondes ou comme amorces pour detecter/amplifier des poly- 
nucleotides (ARN ou ADN genomique) correspondants au polynucleotide 

25 selon I'lnvention, particulierement dans d'autres organismes. 

Les transcrits du gene asap sont par exemple de preference 
mis en evidence a I'aide de sondes selectionnees dans le groupe constitue 
par les sequences SEQ ID NO: 15, SEQ ID NO : 45, SEQ ID NO: 17 a SEQ 
. ID NO: 44 ou a I'aide d'un EST tel que defini ci-dessus ou amplifies par RT- 

30 PCR a I'aide d'amorces selectionnees dans le groupe constitue par les 
sequences SEQ ID NO: 31 a 43. 
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Le polynucleotide selon ('Invention peut permettre de 
diagnostiquer un etat pathologique ou une maladie genetique impliquant un 
dysfonctionnement du gene asap et de cribler des substances capables de 
moduler (activer ou inhiber) la transcription dudit g&ne. 

5 L'lnvention a aussi pour objet les polynucleotides susceptibles 

d'etre obtenus par amplification a Paide des amorces selon l'lnvention. 

Les sondes et amorces selon l'lnvention peuvent etre 
marquees directement ou indirectement par un compose radioactif ou non 
radioactif par des methodes bien connues de Phomme du metier, afin d'obtenir 

10 un signal delectable et/ou quantifiable. 

Le marquage des sondes selon l'lnvention est realist par des 
elements radioactifs ou par des molecules non radioactives. Parmi les iso- 
topes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou l ,125 L Les 
entites non radioactives sont s6lectionnees parmi les ligands tels que la 

15 biotine, Pavidine, la streptavidine, la digoxygenine, les haptenes, les colorants, 
les agents luminescents tels que les agents radioluminescents, chemo- 
luminescents, bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon l'lnvention peuvent ainsi etre utili- 
ses comme amorce et/ou sonde dans des precedes mettant en oeuvre 

20 notamment la technique de PCR (amplification en chatne par polymerase) 
(U.S. N° 4,683,202). D'autres techniques d'amplification de Pacide nucleique 
cible peuvent etre avantageusement employees comme alternative a la PCR 
II existe actuellement de tres nombreux procedes permettant cette amplifica- 
tion, comme par exemple la technique SDA (Strand Displacement Amplifica- 

25 tion) ou technique d'amplification £ d6placement de brin, la technique TAS 
(Transcription-based Amplification System), la technique 3SR (Self-Sustained 
Sequence Replication), la technique NASBA (Nucleic Acid Sequence Based 
Amplification), la technique TMA (Transcription Mediated Amplification), la 
technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain 

30 Reaction), la technique CPR (Cycling Probe Reaction), la technique d'amplifi- 
cation a la Q-beta-replicase. On peut encore citer la PCR-SSCP qui permet 
de d6tecter des mutations ponctuelles. 
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Ces techniques sont bien entendu parfaitement connues de 
Thomme du metier. 

Comme sondes ou comme amorces, les differents poly- 
nucleotides selon Tlnvention peuvent permettent, soit de determiner le profil 

5 de transcription du gene asap correspondent ou une eventuelle alteration de 
ce profil dans un 6chantillon biologique, soit de mettre en evidence le g6ne 
correspondant dans d'autres espdces, des variants alleliques de ce gene ou 
une eventuelle alteration fonctionnelle de ce gene (changement substantiel 
dans Tactivite de la proteine codee par ledit g6ne) resultant d'une mutation 

10 (insertion, delation ou substitution) d'un ou plusieurs nucleotides au niveau 
d'au moins un exon dudit g&ne. De telles mutations incluent en particulier les 
delations, les insertions ou les substitutions non-conservatives au niveau de 
codons correspondant & des r§sidus d'acides amines situes dans un domaine 
essentiel pour Tactivite biologique de la proteine. 

15 Ainsi Tlnvention a pour objet une methode de determination 

du profil de transcription du gene correspondant au polynucleotide selon 
Tlnvention ou d'une alteration dudit profil, dans un echantillon biologique, 
comprenant une premiere 6tape d'obtention par tout moyen appropri6 des 
ARN totaux a partir de Techantillon biologique, une deuxteme etape de mise 

20 en contact desdits ARN. avec une sonde selon Tlnvention, prealablement 
marquee, dans des conditions classiques d f hybridation entre les ARN et la 
sonde et une troisieme etape de revelation par tout moyen approprie des 
hybrides formes. 

Par conditions classiques d'hybridation, on entend cedes 

25 d6crites dans Sambrook J, Russell DW. (2000) Cold Spring Harbor Laboratory 
Press. 

Selon un mode de mise en oeuvre de ladite methode, la 
deuxieme 6tape peut etre une etape de transcription inverse et d'amplification 
des transcrits, realisee & Taide d'une paire d'amorces telles que d6crites 
30 pr6c6demment et la troisieme §tape, une etape de revelation par tout moyen 
approprte des acides nucl6iques amplifies form6s. 
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Ladite methode de determination du profil de transcription du 
gene peut en outre comporter une etape devaluation du taux de transcription 
du gene par comparaison avec un echantillon temoin prealablement choisi. 
Ledit temoin peut etre constitue par exemple par un Echantillon biologique 
5 presentant une transcription normale ou alter6e du gene correspondant au 
polynucleotide selon I'lnvention auquel ladite methode de determination du 
profil de transcription du gene est appliquee dans les memes conditions. 

Ulnvention a aussi pour objet une methode de mise en 
evidence dans d'autres especes du gene correspondant au polynucleotide 

10 selon I'lnvention ou des variants alieiiques dudit gene ou d'une alteration 
fonctionnelle de ce gene, dans un echantillon biologique, comprenant une 
premiere etape d'obtention par tout moyen approprie de I'ADN & partir des 
cellules d'un echantillon biologique, une deuxieme etape de mise en contact 
desdits ADN avec une sonde selon I'lnvention, prealablement marquee, dans 

15 des conditions classiques d'hybridation entre les ADN et la sonde et une 
troisieme etape de revelation par tout moyen approprie des hybrides formes. 

Selon un mode de mise en oeuvre de ladite methode, la 
deuxieme etape peut etre une etape d'amplification realisee a I'aide d'une 
paire d'amorces telles que decrites precedemment et la troisieme etape, une 

20 etape de revelation par tout moyen approprie des acides nucieiques amplifies 
formes. La methode peut eventuellement comporter une quatrieme etape 
d'isolement et de sequengage des acides nucieiques mis en evidence. 

Ulnvention a egalement pour objet une trousse de reactifs 
pour la mise en oeuvre des methodes precedemment decrites comprenant : 

25 a) au moins une sonde ou une paire d'amorces selon I'lnven- 

tion ; . 

b) les reactifs n6cessaires a la mise en oeuvre d'une reaction 
classique d'hybridation entre ladite sonde ou lesdites amorces et I'acide 
nucieique de I'echantillon biologique ; 
30 c) les r6actifs n6cessaires a la mise en oeuvre d'une reaction 

d'amplification ; 
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d) les reactifs necessaires a la detection et/ou au dosage de 
I'hybride forme entre ladite sonde et I'acide nucleique de I'echantillon 
biologique ou des acides nucleiques amplifies formes. 

Une telle trousse peut egalement contenir des controles posi- 
5 tifs ou negatifs afin d'assurer la qualite des resultats obtenus. Elle peut ega- 
lement contenir les reactifs necessaires a la purification des acides nucleiques 
a partir de I'echantillon biologique. 

Le polynucleotide de ^Invention ou un de ses fragment, ainsi que les EST 
decrits precedemment ou Ieur fragments peuvent servir a la mise au point de 

10 modeles cellulaires ou animaux n'exprimant pas la proteine ASAP, en invali- 
dant le gene ASAP par la m6thode de Si RNA (ou RNAi pour RNA inter- 
ference ; M. McManus and P. Sharp, Nature Reviews Genetics, 3, 737-747, 
2002; V. Brondani, F. Kolb, E. Billy, M/S, 6-7, 665-667, 2002) a I'aide 
d'oligonucleotides derives de leurs sequences. 

15 L'lnvention a egalement pour objet un vecteur de clonage 

et/ou d'expression dans lequel est insert le polynucleotide selon l'lnvention. 

Un tel vecteur peut contenir les Elements necessaires a 
Texpression et eventuellement & la secretion de la proteine dans une cellule 
h6te. 

20 Lesdits vecteurs comportent de preference : un promoteur, 

des signaux d'initiation et de terminaison de la traduction, ainsi que des 
regions appropriees de regulation de la transcription, lis doivent pouvoir etre 
maintenus de fagon stable dans la cellule et peuvent Eventuellement 
comprendre des sequences codant pour des signaux particuliers specifiant la 

25 secretion de la proteine traduite tels que par exemple un promoteur fort de 
nature ubiquitaire ou un promoteur s6lectif d'un type de cellule et/ou de tissu 
particulier. Ces differentes sequences de contrdle sont choisies en fonction de 
Thote cellulaire utilise. 

Le polynucleotide selon Tlnvention peut etre insere dans des 

30 vecteurs a replication autonome au sein de rh6te choisi ou des vecteurs inte- 
gratifs de Thote choisi. 
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Parmi les systemes a replication autonome, on utilise de 
preference en fonction de la cellule hdte, des systemes de type plasmidique 
ou viral. Les vecteurs viraux peuvent notamment etre des adenovirus, des 
retrovirus, des lentivirus, des poxvirus ou des virus herpetiques. Uhomme du 

5 metier connaTt les technologies utilisables pour chacun de ces systemes. 

Lorsque Ton souhaite ['integration de la sequence dans les 
chromosomes de la cellule hote, on peut utiliser par exemple des systemes de 
type plasmidique ou viral ; de tels virus sont, par exemple, les retrovirus ou les 
virus associes aux adenovirus (Adeno-associated virus ou AAV). 

10 Parmi les vecteurs non viraux, on pr6fere les polynucleotides 

nus tels que TADN ou TARN nu, les chromosomes artificiels de bacterie (BAC, 
bacterial artificiel chromosome), les chromosomes artificiels de levure (YAC, 
yeast artificiel chromosome) pour I'expression dans la levure, les chromo- 
somes artificiels de souris (MAC, mouse artificial chromosome) pour I'expres- 

15 sion dans les cellules murines et de manure pref6ree les chromosomes artifi- 
ciels d'homme (HAC, human artificial chromosome) pour I'expression dans les 
cellules humaines. 

De tels vecteurs sont prepares selon les methodes couram- 
ment utilisees par I'homme du metier, et les vecteurs recombinants en r§sul- 

20 tant peuvent etre introduits dans I'hote approprie par des methodes standards, 
telles que par exemple la lipofection, Telectroporation, le choc thermique, la 
transformation aprds permeabilisation chimique de la membrane, la fusion 
cellulaire. 

Ulnvention a aussi pour objet les cellules hotes transform6es, 
25 notamment les cellules eucaryotes et procaryotes, dans lesquelles au moins 
un polynucleotide ou un fragment selon Nnvention ou au moins un vecteur 
selon Tlnvention a et6 introduit. 

Parmi les cellules utilisables aux sens de la presente 
Invention, on peut citer les cellules bacteriennes, les cellules de levure, les 
30 cellules animates, en particulier les cellules de mammiferes ou encore les 
cellules vegetates. On peut citer egalement les cellules d'insectes dans 
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lesquelles on peut utiliser des precedes mettant par exemple en oeuvre des 
baculovirus. 

L'lnvention a egalement pour objet les organismes trans- 
geniques non-humains tels que les animaux ou les vegetaux transgeniques, 

5 dont tout ou partie des cellules contient le polynucleotide selon l'lnvention ou 
le vecteur selon l'lnvention, sous une forme libre ou integree. 

De preference selon l'lnvention, les organismes transgeniques 
non-humains sont ceux porteurs de cellules contenant un polynucleotide selon 
l'lnvention, non fonctionnel ou porteur d'une mutation. 

10 Selon l'lnvention les animaux transgeniques sont de prefe- 

rence des mammiferes, excepte I'homme, plus preferentiellement les 
rongeurs, en particulier les souris ou les rats. 

Les animaux transgeniques peuvent etre obtenus par toute 
m6thode classique connue de I'homme du metier, comme par exemple par 

15 recombinaison homologue sur cellules souches embryonnaires, transfert de 
ces cellules souches. a des embryons, selection des chimeres affectees au 
niveau des lignees reproductrices, et croissance desdites chimeres. 

Les cellules hotes transformees, les animaux ou les vegetaux 
transgeniques selon l'lnvention peuvent ainsi exprimer ou surexprimer le gene 

20 codant pour la proteine selon l'lnvention ou leur gene homologue ou exprimer 
ledit gene dans lequel est introduite une mutation. 

Les cellules de testicule ou de cerveau, les cellules hotes 
transformees ou les organismes transgeniques selon l'lnvention peuvent etre 
utilises pour la preparation de la proteine selon l'lnvention. 

25 La proteine selon l'lnvention, particuli&rement la proteine 

ASAP native, peut etre purifiee selon les techniques connues de I'homme du 
metier. Ainsi, la proteine peut etre purifiee a partir de lysats et extraits cellu- 
laires, du surnageant du milieu de culture, par des methodes utilisees indivi- 
duellement ou en combinaison, telles que le fractionnement, les methodes de 

30 chromatographie, particulierement de chromatographie d'affinite, les 
techniques d'immunoaffinite a I'aide d'anticorps monoclonaux ou polyclonaux 
sp6cifiques, etc... 
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L'lnvention a egalement pour objet une methode de prepara- 
tion de la proteine ASAP, se caracterisant en ce que Ton cultive des cellules 
exprimant la proteine ou des cellules transformees selon la presente Inven- 
tion, notamment les cellules de mammiferes ou les cellules d'organismes 
5 transgeniques selon l'lnvention, dans des conditions permettant I'expression 
de ladite proteine, et que Ton purifie ladite proteine. 

Comme technique de purification, on peut citer par exemple la 
chromatographic d'affinite sur glutathione-sepharose (ou agarose) telle que 
decrite dans Sambrook J & Russell DW. (2000, Cold Spring Harbor 
10 Laboratory Press). 

L'lnvention a §galement pour objet une proteine, caracterisee 
en ce qu'elle est susceptible d'etre obtenue par I'une quelconque des 
methodes de preparation ci-dessus decrites. 

L'lnvention a encore pour objet une methode de criblage 
15 d'une substance capable d'interagir in vitro, directement ou indirectement, 
avec le polynucleotide ou la proteine selon l'lnvention caracterisee en ce que : 

dans une premiere 6tape on met en contact la substance 
a tester et le polynucleotide ou la proteine selon l'lnvention et 

dans une deuxieme 6tape on detecte par tout moyen 
20 approprie le complexe forme entre ladite substance et le polynucleotide ou la 
proteine selon l'lnvention. 

La presente invention a Egalement pour objet une methode de 
criblage d'une substance capable de moduler (activer ou inhiber) I'activite de 
la proteine ASAP, caract6ris6e en ce que : 
25 - dans une premiere 6tape on met en contact des cellules d'un 

6chantillon biologique exprimant la proteine ASAP avec une substance a 
tester, 

- dans une deuxieme etape on mesure par tout moyen appro- 
prie I'effet de ladite.substance sur I'activite de ladite proteine ASAP, et 
30 - dans une troisi^me 6tape on s6lectionne des substances 

capables de moduler ladite activite. 
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Au sens de la presente invention, on entend par activite de la 
proteine ASAP, aussi bien Texpression de la proteine ASAP ou des transcrits 
(ARNm) correspondants, que I'activite biologique de ladite proteine ASAP, 
comme par exemple son effet sur ('organisation du fuseau mitotique ou 
5 Tinduction de mitoses aberrantes et abortives. 

La detection du complexe forme entre ladite substance et le 
polynucleotide ou la proteine ou la mesure de Teffet de ladite substance sur 
Tactivite de ladite proteine ASAP peuvent etre realis6es par les techniques 
classiques d'analyse d'ARNm ou de proteines qui sont connues en 
10 elles-memes ; a titre d'exemple non-limitatif, on peut citer les techniques 
suivantes : RT-PCR, Northern-blot, Western-blot, RIA, ELISA, immunopreci- 
pitation, techniques d'analyse immunocytochimique ou immunohistochimique. 

Avantageusement, ladite mesure est realisee a Taide des 
sondes, des amorces ou des anticorps, tels que definis ci-dessus. 
15 De telles substances peuvent etre des macromolecules 

biologiques comme par exemple un acide nucieique, un lipide, un sucre, une 
proteine, un peptide, un compost hybride proteine-lipide, proteine-sucre, 
peptide-lipide ou peptide-sucre, une proteine ou un peptide sur lequel on a 
ajoute des ramifications chimiques ou encore des molecules chimiques. 
20 ^Invention a egalement pour objet le polynucleotide, la 

proteine, les anticorps, les vecteurs ou les cellules transformees selon Tlnven- 
tion, utilises comme medicaments. 

Comme indique pr6cedemment, la surexpression de la 
proteine selon ['Invention bloque la division cellulaire et par consequent la 
25 proliferation cellulaire. Cela en fait un excellent candidat pour une utilisation 
comme agent anti-mitotique, utilisable par exemple dans le traitement des 
pathologies canc6reuses. 

Ainsi, Tlnvention a egalement pour objet Tutllisation du poly- 
nucleotide, d'un vecteur ou de la proteine selon Tlnvention, dans la prepara- 
30 tion d'un medicament anti-mitotique. 

De meme comme il est 6galement indique precedemment, la 
surexpression de la proteine selon Tlnvention entraine des perturbations dans 
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Torganisation du fuseau mitotique et induit des mitoses aberrantes et abor- 
tives (cellules plurinucleees, fuseaux mono- ou multipolaires). 

Ainsi, rinvention a aussi pour objet I'utilisation d'un poly- 
nucleotide anti-sens ou d'un fragment anti-sens, d'un anticorps, d'un vecteur 

5 contenant un oligonucleotide anti-sens selon rinvention, capables d'inhiber 
I'expression du polynucleotide ou de la proteine selon rinvention, dans la 
preparation d'un medicament destine au traitement des pathologies liees aux 
perturbations dans Torganisation du fuseau mitotique et/ou a une induction 
des mitoses aberrantes et abortives (cellules plurinucleees, fuseaux mono- ou 

10 multipolaires) liees & la surexpression de la proteine selon rinvention. 

Outre les dispositions qui precedent, rinvention comprend 
encore d'autres dispositions qui ressortiront de la description qui va suivre, qui 
se refere a des exemples de mise en oeuvre de rinvention ainsi qu'aux 
dessins annexes, dans lesquels : 

15 - La Figure 1 represente la localisation chromosomique et la 

structure du gene asap humain. 

- La Figure 2 represente les signaux obtenus par Northern 
blots sur differents tissus humains apres hybridation avec une sonde hASAP. 

- La Figure 3 represente les r6sultats obtenus : 

20 (A) par eiectrophorese sur gel d'agarose des produits de 

RT-PCR obtenus avec des amorces correspondant au polynucleotide de 
souris, orthologue du polynucleotide SEQ ID NO: 15, a partir de differents 
tissus de souris. 

(B) Apres transfert du gel apres eiectrophorese sur une 
25 membrane et hybridation avec une sonde mASAP interne. 

- La Figure 4 represente la localisation cellulaire de la proteine 
hASAP coupiee & la Green Fluorescent Protein (GFP) en 3' ou la Yellow 
Fluorescent Protein (YFP) en 5 1 ou & un tag MYC du cote N-terminal (colonne 
fusion). 

30 Les noyaux sont color6s & riodure de propidium ou au 

Hoechst 33286. (4A : objectif 63x ; 4B, 4C, 4D : objectif I00X). 

- La Figure 5 montre la co-localisation de la proteine ASAP 
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humaine avec I'alpha-tubuline. Figure 5 A : localisation cellulaire de I'alpha- 
tubuline, Figure 5 B : localisation de la proteine ASAP, Figure 5 C : superposi- 
tion des 2 images montrant la colocalisation des 2 proteines. 

Les exemples suivants sont illustratifs de ('Invention et ne la 
5 limitent aucunement. 

EXEMPLE 1 : Construction de la sequence codante ASAP complete : 

On amplifie la sequence complete de I'ADNc de la proteine 
ASAP a partir de 2 fragments chevauchants : 

- un fragment A amplifie par PCR a partir du clone AI885274 
10 avec les amorces : 

constFIS-1 F (5'-ATGTCTGATGAAGTTTTTAGCACC-3') (SEQ 

ID NO: 31) et 

constFIS-2R (5'-AGGCCTCAAATG ATGCTAATGC -3') (SEQ 

ID NO: 32) ; 

15 - un fragment B amplifie a partir du clone AI671785 avec les 

amorces : 

constFIS-2F (5'-ATCATTTGAGGCCTGGAAGGC-3') (SEQ ID 

NO: 33) et 

et constFIS-1R (5'-AAACACTTTTGCGAACACAGTTC-3') 
20 (SEQ ID NO: 34). 

Puis, pour obtenir un produit PCR unique correspondant a la 
sequence complete de I'ADNc de la proteine ASAP, utilisable pour les expe- 
riences de fonction, 0,5 pi des produits de chacune des 2 reactions PCR 
(fragment A et B) sont hybrides ensemble a 25°C puis amplifies avec les 
25 amorces constFIS-1F et constFIS-2F. Ce produit PCR est sous-clone dans le 
vecteur PCR4 suivant les recommandations du fabricant (Invitrogen) et verifie 
par sequencage. 

Les difficultes majeures rencontr§es se sont situees dans la 
determination in silico de la sequence codante complete ASAP et de sa 
30 reconstruction in vitro. En particulier, le choix des amorces et des differentes 
PCR de la region 3' ont ete delicats en raison de la richesse de la sequence 
en polyA. 
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EXEMPLE 2 : Analyse bio-informatique 

La Figure 1 represente la localisation chromosomique et la 
structure du gene asap humain. 

L'organisation complete du gene asap et sa localisation 

5 chromosomique ont ete obtenues en comparant la sequence de I'ADNc 
obtenu a I'exemple 1, a la sequence du genome humain en utilisant les 
programmes du Wellcome Trust Sanger Institute 
(httl2://www.ensembl.oriz/genome/central/ et plus precisement le programme 
de recherche BLAST (htip://genome.cse.ucsc.edu/). 

10 Le gene humain asap est constitue de 29750 nucleotides 

comprenant 14 exons dont 13 seulement sont traduits, le premier exon n'etant 
pas traduit. La taille des exons s'echelonne de 71 a 321 paires de bases. La 
sequence du gene est contenue dans le contig AC097467 (longueur 178204 
paires de bases) entre les bases 115117 et 143828 (version v.7.29a3 

15 NCBI/Ensembl du 12 juillet 2002, http ://www.ensembl.org), et est par ailJeurs 
localisee sur le chromosome 4q32.1 entre les marqueurs anonymes D4S1053 
et D4S571 (region 161,25 Megabases (Mb) a 161,28 Mb). La sequence du 
gene est physiquement contenue dans le clone BAC RP1 1-27G13. 

Deux acides nucleiques correspondants a des fragments du 

20 polynucleotide isole par les Inventeurs sont repertories dans la base de 
donnees GenBank sous les numeros d'acces AK024730 et AK024812, ainsi 
que les EST repertories sous les numeros d'acces BU1 98882, BM693711, 
AW372449, BM021380, BU928828, AL707573, AI885274, AI671785, 
AA805679, BU619959, BM021126, AL598336, AW976973, BU629726, 

25 AI433877, AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, 
BU684090, BF958121, BQ351941, AW1 94906, BG203580, BF078132, 
AW486134, AL600279, AA025538, AL600264, BF170676, BU759494, 
BB025236, BF214179, AI283076, BE694273, AI266380, BM670854, 
AA968415, BU503982, BB700612, BE988355, BU058357, BB312934, 

30 AW061311, BM537962, BE988356, BB318982, BB311217, BB557152, 
BB1 85248, BB557128, BB698742, BB 186736, AV345769, BB274293, 
BB632007, BB617958, AI391312, W18534, BB186581, BB311289, 



WO 2004/058815 PCT/FR2003/003895 

29 

BB312835, AW347411, AA972439, BB263570, AU035125, BB277226, 
BB274224, BB268445, AW024037, AA025609, BB274174, R96089, 
BB272238, BB269037, BB385718, BE007324, BB325992, AJ275277, 
AI414381, BB125476, BB430961, BE232162, BQ121419, BQ121418, 

5 BG591509, BF457670, AL897593, AL897592, BM926692, BM538559, 
BI759567, AL601021, AL598780, AU222540, BG567619, AU166296, 
BF889835, AU164011, AV656025, BF343454, AW262441, AW237952. Ces 
sequences, obtenues dans le cadre d'un programme de sequencage en 
masse de banques d'ADN complementaires humains, sont incompletes et 

10 n'ont jamais ete ni reconnues ni caracterisees. 

La sequence proteique a ete comparee aux sequences des 
banques de donnees en utilisant les programmes PSI-BLAST et PHI-BLAST 
du NCBI (http://w\ww.ncbi.nlm.nih.gov/Sitemap/). Des motifs proteiques 
consensus ont ete recherches en utilisant les programmes DART du NCBI et 

15 SMART d'ExPASy-Tools (http://www.expasy.ch/tools/#similariw), dont les 
parametres permettent de detecter des motifs de faible homologie. La 
proteine ASAP presente une identite de sequence de 23% sur le tiers 
C-terminal avec une proteine associee aux microtubules (MAP 1A pour 
Microtubule-Associated-Protein 1A). Par ailleurs la recherche de motifs 

20 conserves (DART on SMART) revele des domaines de type caldesmon 
(Gusev, N.B., Biochemistry, 10 1112-1121, 2000) et ERM 
(Ezrin/radixin/moesin) (Louvet-Vallet, S., Biol. Cell, 274 : 305-316, 2000), qui 
sont des proteines egalement considerees comme des MAPs, avec des 
identites d'environ 20%. Elle presente egalement un domaine BRCT (Breast 

25 cancer carboxy-terminal domain; Bork, P., et coll., FASEB J., 11, 68-76 
(1997)) entre les positions 65 et 303. 

La proteine ASAP presente des domaines coiled-coil essen- 
tiellement regroupes dans sa partie C-terminale entre les acides amines 297 
et 327 d'une part et 477 et 628 d'autre part, indiquant soit que la proteine 

30 s'oligomerise, soit qu'elle interagit avec d'autres proteines. 

L'analyse informatique de la proteine a I'aide des programmes 
accessibles dans le site internet (http://npsa-bil.ibcp.fr/cgi- 
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bin/npsa_automat.pl?page=/NPSA/npsa_secons.html), revele I'absence de 
feuillet B et une tres grande richesse en helices a, en particulier pour la region 
comprise entre les acides amines 420-620, presque exclusivement formees 
d'helices a. 

5 Ces elements permettent de penser que la proteine ASAP est 

une nouvelle MAP. 

EXEMPLE 3 : Expression tissulaire 

a) Analyse par Northern blot 

Preparation des sondes radioactives : 

10 Les ADN a radiomarquer sont isoles sur gel a bas point de 

fusion (LMP) selon la technique decrite dans Rouquier, S. et al., (Genomics, 
17, 330-340, (1993)). Environ 100 ng d'ADN ainsi isole, sont marques par 
amorcage aleatoire (fragment de Klenow, Promega) en presence de [a 32 P 
dCTP] (Amersham) selon la technique decrite dans Feinberg, A.P. & 

15 Vogelstein, B., (Anal. Biochem., 132, 6-13, (1983)). Ces sondes sont purifiees 
sur des colonnes de Sephadex G-50 selon la technique decrite dans 
Sambrook J & Russell DW. (2000, Cold Spring Harbor Laboratory Press). Les 
hybridations s'effectuent durant la nuit en presence de 2.10 6 Cpm/ml de sonde 
radioactive d6naturee. 

20 a.1) Hybridation 

Deux membranes Northern Blot de la societe Clontech, 
(Human MTN Blot at Human MTN Blot II, Ref. 7760-1 et 7759-1) comportant 
des ARNm humains de differents tissus ont ete hybridees avec I'ADNc hASAP 
complet marque comme decrit ci-dessus. La membrane est hybridee en 

25 presence de formamide a 42°C, en suivant le protocole Clontech. Un contr6le 
d'hybridation de la membrane est realise avec une sonde actine. La 
membrane est rincee 2 fois a haute stringence en 0,1 X SSC/0,1% SDS a la 
temperature de 42°C, pendant 15 minutes. Les membranes sont alors analy- 
sees par autoradiographie ou au PhOsphorimager. 

30 Les tissus testes sont : la rate, le thymus, la prostate, le testi- 

cule, I'ovaire, I'intestin gr§le, le colon, les leucocytes sanguins, le cceur, le 
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cerveau, le placenta, le poumon, le foie, le muscle squelettique, le rein et le 
pancreas. 

a. 2) R&suttats 

La Figure 2 illustre ces resultats. 
5 Deux slgnaux sont detectes : 

- un signal dans le testicule a environ 2,6 kb, ce qui correspond a 
la taille de I'ARNm ; 

- un signal dans le cerveau mais a un haut poids moleculaire (9 
kb) qui correspond soit a un premessager, soit a une isoforme de haut poids 

10 moleculaire 

b^ Analyse par RT-PCR 

Cette analyse a ete effectuee sur des ARNs totaux de diffe- 
rents tissus de souris, a savoir le cerveau, le cceur, le colon, le foie, I'intestin 
grele, le muscle squelettique, le pancreas, le poumon, le rein, la rate et le 

15 testicule. 

b. 1 ) Qbtention de J.'ADNc orthpjoguede souris 

Les ARNs totaux de cellules de differents tissus de souris sont 
extraits avec le "mammalian total RNA kit" de la societe Sigma. Les ARN sont 
retro-transcrits avec le kit Superscript II de la societe Invitrogen selon les 

20 conditions prescrites par le fournisseur et en utilisant des amorces oligodT. 
Les produits obtenus sont verifies par electrophorese sur gel d'agarose a l%. 
1 pi de chaque echantillon ainsi obtenu est a son tour amplifie par PCR (25 pi 
de milieu de reaction, 30 cycles (94°C pendant 15 secondes, 55°C pendant 30 
secondes, 72°C pendant 30 secondes)) avec des amorces specifiques du 

25 genes asap de souris (mFIS-1F, 5'-ACA ACG AAT AAC AGA GTG TCC-3' 
(SEQ ID NO: 35) et mFIS-2R, 5'-ACT CCT GAT AAA CAG CTG CC-3' (SEQ 
ID NO: 36). 

Les produits amplifi6s obtenus sont analyses par electro- 
phorese sur gel. d'agarose a 1%, colores au bromure d'ethydium et leur taille 
30 comparee a un marqueur de taille depose sur le gel en parallele. 

Apres electrophorese, les produits amplifies obtenus sont 
transferes par capillarite sur membrane de nylon chargee, dans le tampon 
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NaCI 1,5M/NaOH 0,5M, selon la technique de Southern (transfert alcalin). La 
membrane est ensuite hybrid6e avec une sonde radiomarquee mASAP, (SEQ 
ID NO: 44), gener6e par amplification de la sequence contenue dans le clone 
de souris AW06131 selectionne apr6s comparaison de la sequence ASAP 

5 humaine dans les banques de donnees (GenBank) 
(http://expression.gnf.org/promoter/tissue/images/41739_s_at.png). 

^amplification a ete realisee par PCR (conditions telles que 
decrites ci-dessus dans lesquelles le volume de reaction est de 50 pi et le 
dCTP froid est a la concentration de 10 pM supplements avec 50 pCi d f a-P 32 - 

10 dCTPa 3000Ci/mmole), en utilisant les amorces mFIS-1F (SEQ ID NO: 35) et 
mFis-2R (SEQ ID NO: 36). Les hybridations sont realisees a 65°C (dans du 
tampon 6X SSC/0,5% SDS/5X Denhardt). La membrane est rinc6e a forte 
stringence (0,IX SSC/0.1% SDS), puis analysee par autoradiographie ou au 
Phosphorlmager. 

15 b.2) Resultats 

La Figure 3 illustre ces resultats. 

On constate qu'on obtient un signal majoritaire dans le testi- 
cule et le cerveau, nettement visible sur gel (Figure 3A). 

Apr6s transfert du gel et hybridation avec une sonde interne, 
20 on constate que Ton detecte un signal tres faible dans les autres tissus (Figure 
3B). 

Par consequent I'ARNm codant pour la proteine mASAP est 
majoritairement exprim§ dans le testicule et le cerveau. L'ADNc complet de 
souris, amplify par RT-PCR a partir de TARN de testicule de souris, 
25 correspond a la sequence SEQ ID NO : 45 et la proteine correspondante 
(mASAP) a la sequence SEQ ID NO : 46. 
EXEMPLE 4 : Localisation cellulaire 

a) Sous-clonage de TADNc hASAP dans un vecteur d'expression eucarvote 

L'ADNc hASAP obtenu a Texemple 1 est insere dans trois 
30 vecteurs d'expression : 

1- dans pEAK10-EGFP en phase avec la Green Fluorescent 
Protein (GFP) fusionnee en C-terminal (vecteur 1) (pEAKIO, vecteur de Edge 
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Biosystems (distribue par Q.BIOgene, lllkirch en France) dans lequel a ete 
introduit la proteine EGFP (enhanced Green Fluorescent Protein) suivant la 
reference Gaillard, I., etal., Eur. J. Neurosci., 15, 409-418, 2002) ; 

2- dans pEYFP-C1 en phase avec la Yellow Fluorescent 
5 Protein (YFP) fusionnee du cote N-terminal (vecteur 2) (distribue par BD 

Biosciences Clontech)) ; 

3- dans GLOMYC3-1 comportant un tag MYC du cote 
N-terminal (vecteur 3) , vecteur derive du vecteur pcDNA3.1 (Invitrogen), dans 
lequel ont ete inserees une region 5' non-traduite (5' UTR) et un tag MYC aux 

10 sites Hindlll-BamHI, et la region 3'UTR de la globine (fragment Spel-Xbal 

dans le site Xbal). 

L'ADNc hASAP est amplifie a partir de son vecteur de clonage 

initial (pCR4-TOPO) par PCR en utilisant la polymerase haute-fidelite pfu 

Turbo, a I'aide d'amorces amplifiant I'ADNc entre la methionine de depart et le 
15 dernier acide amine. Les produits amplifies obtenus sont sous-clones dans les 

3 vecteurs. 

- Clonage dans PEAK-GFP. Preparation de I'insert d'ADN 
par PCR [94°C 2 min ; (94°C 15 sec; 58°C 30 sec; 72°C 1min 30 sec) 30 
cycles ; 72°C 3 min.], a I'aide des amorces 
20 hFIS-Exp1F (5'-GCC ACCATGTCTGATGAAGTTTTTAGC AC -3) (SEQ ID NO: 
37) et 

hFIS-Exp1R (5'-GAAACACTTTTGCGAACACAGTTC-3 , ) (SEQ ID NO: 38). 

Le vecteur est coupe par EcoRV et dephosphoryle : 10 ng de 

vecteur sont utilises pour la ligation avec I'insert d'ADN. Le produit PCR est 
25 phosphoryle puis purifie sur high PURE PCR kit (Roche) : 100 ng d'insert sont 

utilises pour la ligation [12h a 16°C dans 10 pi final (ligase Biolabs), suivant 

les conditions standards (Sambrook and Russell)]. 

Clonage dans Glomyc : Preparation de I'insert d'ADN par 

PCR [94°C 2 min ; (94°C 15 sec; 60°C 30 sec; 72°C 1min 30 sec) 30 
30 cycles ; 72°C 3 min.], a I'aide des amorces : 

Glomyc-FIS1F : (5-TAATGTCTG ATGAAGTTTTTAGCACC -3') (SEQ ID NO: 

39) et 
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Glomyc-FIS1R : (5'-TCAAAACACTTTTGCGAACACAGTTC -3') (SEQ ID NO: 
40). 

Conditions de clonage identiques a celles decrites pour le 
clonage dans PEAK-GFP. 
5 - Clonage dans YFP : Preparation de I'insert d'ADN : memes 

conditions que pour Glomyc, a I'aide des amorces : 

YFP-FIS1F (5'-AATGTCTGATGAAGTTTTTAGCACC -3') (SEQ ID NO: 41) et 
Glomyc-FIS1R (SEQ ID NO: 40) (cf ci-dessus). 

Conditions de clonage identiques a celles decrites pour le 
10 clonage dans PEAK-GFP, le vecteur ayant prealablement ete coupe par 
Sma1. 

Les recombinants sont analyses par PCR en utilisant une 
amorce du vecteur et une amorce interne. 

PEAK-GFP : annealing a 58°C, extension 45 sec. a 72°C. et conditions 
15 standards pour le reste. Amorces : constFIS-2F (SEQ ID NO: 33) et GFP-1R 
(5'-TCAGCTTGCCGTAGGTGGC-3') (SEQ ID NO: 42). 
YFP : annealing 55°C pendant 1 min. ; Amorces : YFP-2F (5- 
ATGGTCCTGCTGGAGTTCG-3') (SEQ ID NO: 43) et hFIS-Exp1R (SEQ ID 
NO: 38) . 

20 Glomyc : annealing 44°C, extension 45 sec. a 72°C. Amorces : constFIS-2F 
(SEQ ID NO: 33) et SP6. Les recombinants sont sequences par sequencage 
automatique a facon a partir des produits PCR (Genome Express, Meylan). 

b) Sous-clonaae de I'ADNc hASAP dans un vecteur d'expression procarvote 

En utilisant une strategie similaire a celle utilisee au para- 
25 graphe a) ci-dessus, I'ADNc hASAP a ete clone dans le vecteur pGEX-4T2 
(AMERSHAM), de facon a produire une proteine de fusion avec la GST, 
purifiable selon les protocoles standards. 

c) Sous-clonaae de I'ADNc mASAP dans un vecteur d'expression procarvote 
ou eucarvote , . 

30 En utilisant une strategie similaire a celle utilisee au para- 

graphe a) ci-dessus, I'ADNc mASAP a ete clone dans les vecteurs suivants : 
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- pGEX-4T2, (AMERSHAM), de fa9on a produire une proteine 
de fusion avec la GST, purifiable selon les protocoles standards. 

- pEYFP-C1 de fagon & produire une proteine de fusion (fusion 
N-terminale) avec la Yellow Fluorescent Protein (YFP) detectable par 

5 immunofluorescence directe. 

d) Transfection. immunofluorescence et microscopie 
d.1) rnat6riels.et.m§th 

Les vecteurs obtenus sont transfectes selon la technique au 
phosphate de calcium ou de fa?on plus routiniere en utilisant le precede 
10 jetPEI (GDSP10101, Qbiogene) suivant les recommandations du fabricant, 
dans les lignees cellulaires suivantes : 

- PEAK (ref. 37937, Edge Biosystems (distribue par 
Q.BIOgene, lllkirch en France), uniquement pour les constructions ASAP 
humaines, 

15 - HEK-293 (ATCC (American Tissue Culture Collection) refe- 

rence CRL-1573 ; p53 -/- non synchronisable), pour les constructions ASAP 
humaines et murines, 

- NIH3T3 non-transformees (constructions ASAP murines), et 

- U-2 OS (ATCC HTB-96 ; p53 +/-, synchronisable) 

20 Pour les vecteurs 1) et 2) (constructions ASAP humaines et 

murines), les localisations se font directement par detection de la fluorescence 
de la GFP ou de I'YFP a 24h, 48h et 72h apres fixation des cellules au para- 
formaldehyde et coloration des noyaux soit au propioiodure de propidium, soit 
au Hoechst 33286. 

25 Pour le vecteur 3) la detection du tag MYC est r6alisee a 

I'aide d'un anticorps primaire anti-MYC distribue par TEBU (9 E10, cat.#SC- 
40, Santa Cruz Biotechnology, CA) et d'un anticorps secondare de ch6vre 
anti-IgG de souris marque au fluorochrome Alexa-594 (Molecular Probes, ref. 
A-1 1032, distribue en France par Interchim, Montlupon), apr6s la fixation des 

30 cellules et leur permeabilisation au Triton X100 0,1%. Les lames sont analy- 
sees, et les images collectees sur un microscope Zeiss Axiophot. 
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d.2) RAsuftate :. Lo^^ 
avec J/alpha-tubuJjne 
- localisation cellulaire 

La Figure 4 illustre la localisation cellulaire de la proteine 
5 hASAP surexprimee dans la lignee HEK-293 (IP = lodure de propidium). 

L'observation au microscope a fluorescence des lames 
correspondant aux differentes transfections par les vecteurs 1), 2) et 3) 
montrent les memes types de profil : la localisation des proteines hASAP et 
mASAP est cytoplasmique et son profil fibreux rappelle celui des filaments de 
10 tubuline. 

Par ailleurs, il semble que les cellules transferees presentent 
des d§fauts de division car les noyaux sont toujours plus gros que dans les 
cellules non transferees (Figure 4A et 4B). De plus, certaines des cellules 
transferees semblent plurinucleees (Figure 4B). Ceci suggere une division 

15 anormale des cellules transferees. 

Enfin, la mitose des cellules transferees semble anormale, 
tant au niveau de I'organisation des chromosomes, que du profil de localisa- 
tion des proteines hASAP et mASAP au niveau du fuseau mitotique. Le profil 
de localisation des proteines hASAP et mASAP, en etoile, est caracteristique 

20 de la nucleation des microtubules en aster autour du centrosome (Figures 4C 
et 4D). 

Un profil similaire de localisation de la proteine ASAP est 
detecte dans la lignee U-2 OS (p53 +/-) surexprimant hASAP et dans la lignee 
NIH 3T3 non-transformee surexprimant mASAP ; une accumulation de 
25 cellules monopolaires en mitose est observee. 

En outre, en synchronisant les cellules U-2 OS et en recupe- 
rant les extraits cellulaires a differents moments du cycle, il a ete verifie que la 
proteine ASAP etait bien presente dans toutes les phases du cycle cellulaire 

(interphase, S, G2/M). - 

30 - colocalisation de la proteine ASAP avec I'alpha-tubuline 

La Figure 5 illustre la co-localisation de la proteine ASAP 
humaine avec I'alpha-tubuline ; de meme la proteine ASAP murine co-localise 
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avec I'alpha-tubuline. 

La Figure 5 A illustre la localisation cellulaire de I'alpha- 
tubuline detectee par immunofluorescence a I'aide d'un anticorps anti-tubuline 
(Alexa-594, Molecular Probe). 
5 La Figure 5 B illustre la localisation de la proteine ASAP 

marquee a la YFP (yellow fluorescent protein). 

La Figure 5 C represents la superposition des 2 images 
demontrant la colocalisation des 2 proteines. 

EXEMPLE 5 : Production d'anticorps polyclonaux anti-hASAP et mASAP 

10 a) Production d'anticorps 

Les constructions suivantes de la proteine ASAP ont ete 
donees dans le vecteur d'expression procaryote pGEX 4T-2 (AMERSHAM) 
comme decrit a I'exemple 4 : 

- proteine ASAP humaine entiere (SEQ ID NO : 1) 

15 - proteine humaine deletee de sa partie C-terminale contenant 

le domaine MAP potentiel (residus 1 a 421, SEQ ID NO : 47) 

- proteine murine entiere (SEQ ID NO : 46). 

Les proteines ont ete exprimees dans E. coli et purifiees selon 
les protocoles standards. Des lapins ont ensuite ete immunises avec les 
20 proteines ASAP purifiees selon un protocole standard, et les serums immuns 
ont ete recoltes. 

b) Analyse de la reactivite des serums polvclonaux vis-a-vis de la proteine 
ASAP endoaene . 

Les serums polyclonaux monospecifiques diriges contre la 

25 proteine hASAP entiere ou deletee de sa partie C-terminale contenant le 
domaine MAP potentiel, ont ete testees en Western-blot et en immunofluores- 
cence, sur des cellules HEK-293 et U-2 OS, selon des protocoles standards. 

En Western-blot, le serum polyclonal monospecifique dirige 
contre la proteine hASAP entiere detecte une proteine d'un poids moleculaire 

30 apparent d'environ 110 kDa correspondant a la proteine ASAP endogene, 
aussi bien dans les cellules HEK-293 que les cellules U-2 OS. Dans ces 
conditions, un anticorps anti-FLAG, detecte une proteine de poids moleculaire 
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equivalent, dans des cellules controle HEK-293 ou U-2 OS, transfectees par 
un vecteur d'expression de la proteine hASAP fusionnee avec une etiquette 
FLAG. 

En immunofluorescence, le s6rum polyclonal monospecifique 
5 dirige contre la proteine hASAP entiere marque les microtubules des cellules 
HEK-293 en interphase, les asters des cellules en mitose et les microtubules 
du corps residue! en fin de telophase. 

Le s6rum polyclonal monospecifique dirige contre la proteine 
hASAP deletee de sa partie C-terminale contenant le domaine MAP potentiel 
10 presente le meme profil en immunofluorescence et detecte une proteine 
d'environ 110 kDa, en Western blot. 

Le serum polyclonal monospecifique dirige contre la proteine 
mASAP est utilise pour detecter quels sont les types cellulaires exprimant 
ASAP et a quel(s) stade(s) du cycle cellulaire elle est exprimee, par immuno- 
15 fluorescence sur des coupes testiculaires de souris. 

EXEMPLE 6 : Analyse fonctionnelle de la proteine hASAP a I'aide de 
mutants deletes de la partie N-terminale contenant le domaine BRCT ou 
de la region C-terminale contenant le domaine MAP potentiel. 

Des fragments d'ADNc codant pour une proteine hASAP 
20 deletee de la partie N-terminale contenant le domaine BRCT (NdeM : residus 
304 -647 (SEQ ID NO : 48) ; Ndel2 : residus 411-647 (SEQ ID NO : 49) ; 
Ndel3 : residus 478-647 (SEQ ID NO : 50)) ou de la partie C-terminale 
contenant le domaine MAP (Cdeh : residus 1 a 477 (SEQ ID NO : 51) ; 
Cdel2 : residus 1 a 418 (SEQ ID NO : 52) ; Cdel3 : residus 1 a 303 (SEQ ID 
25 NO : 53)) ont ete amplifies par PCR a I'aide d'amorces appropriees puis 
clones dans les vecteurs d'expression pEAK1 0-EGFP (fusion C-terminale 
avec la GFP) et pEYFP-C1 (fusion N-terminale avec la YFP) selon un 
protocole similaire a celui decrit a I'exemple 4. 

Les differentes constructions ont ete transfectees dans les 
30 lignees HEK-293 et U-2 OS puis la localisation cellulaire des differents 
mutants de la proteine hASAP a ete analysee comme decrit a I'exemple 4. 
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On constate que pour les memes deletions, un profil similaire 
est obtenu avec la construction comportant la YFP en N-terminal ou la GFP 
en C-terminal. 

Par comparaison avec la proteine hASAP entiere, les 3 
5 constructions deletees de la partie C-terminale ne colocalisent plus en inter- 
phase avec la tubuline et ne presentent plus un aspect fibreux ; ces resultats 
indiquent que la deletion interesse un domaine MAP. En outre, aucune cellule 
monopolaire bloquee en mitose n'est observee dans les cellules surexprimant 
les mutants deletes de la partie C-terminale contenant le domaine MAP. 
10 Par comparaison avec la proteine hASAP entiere, les 3 

constructions deletees de la partie N-terminale contenant le domaine BRCT, 
presentent une localisation nucleaire sous forme de foyers mais il reste dans 
le cytoplasme quelques fibres co-localisant avec la tubuline. 

L'analyse fonctionnelle de la proteine hASAP est completee 
15 par des experiences deactivation de I'expression du gene par des ARN 
interferents (ARNi). 
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REVENDICATIONS 

1°) Proteine isolee, denommee ASAP, caracterisee en ce 
qu'elle est selectionnee dans le groupe constitue par : 

a) une proteine repondant a la sequence representee dans 
5 la liste de sequences en annexe sous le numero SEQ ID NO: 1, corres- 
pondent a la proteine ASAP humaine, et 

b) une proteine presentant, sur la totalite de sa sequence, au 
moins 80% d'identite ou au moins 90% de similarite, de preference au moins 
90 % d'identite ou moins 95% de similarite, avec la proteine de sequence 

10 SEQ ID NO: 1. 

2°) Proteine selon la revendication 1, caracterisee en ce qu'elle 
presente la sequence SEQ ID NO: 46 correspondant a la proteine ASAP 
murine. 

3°) Peptide, caracterise en ce qu'il est constitue d'un fragment 
15 d'au moins 10 acides amines consecutifs d'une proteine selon la revendication 
1 ou la revendication 2. 

4°) Peptide selon la revendication 3, caracterise en ce qu'il est 
selectionne parmi les sequences representees dans la liste de sequence en 
annexe sous les numeros SEQ ID NO: 2 a SEQ ID NO: 14 et SEQ ID NO: 47 
20 a 53. 

5°) Proteine variante de la sequence SEQ ID NO: 1 ou de la 
sequence SEQ ID NO: 46, caracterisee en ce qu'elle presente une mutation 
entraTnant un dysfonctionnement de la proteine. 

6°) Proteine ou peptide selon I'une quelconque des revendica- 
25 tions 1, 3, 4 ou 5, caracterisee en ce qu'il s'agit d'une proteine ou d'un peptide 
d'origine humaine. 

7°) Polynucleotide isole, repondant a une sequence selection- 
nee dans le groupe constitue par : 

- les sequences codant pour une proteine ou pour un 
30 peptide selon I'une quelconque des revendications 1 a 6 ; 
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les sequences representees sous les numeros SEQ ID 
NO: 15 et SEQ ID NO: 45 dans la liste de sequences en annexe, corres- 
pondant respectivement aux ADNc ASAP humain et murin, 

- le fragment d'ADN genomique de 29800 nucleotides 

5 repondant a la sequence representee dans la liste des sequences en annexe 
sous le num6ro SEQ ID NO: 16, correspondant au g£ne asap humain ; 

un fragment d'au moins 15 nucleotides consecutifs de 
Tune quelconque des sequences precedentes, a Pexclusion des sequences 
repertories sous les numeros d'acces AK024730 et AK024812 et des EST 

10 repertories sous numeros d'acces BU1 98882, BM693711, AW372449, 
BM021380, BU928828, AL707573, AI885274, AI671785, AA805679, 
BU619959, BM021126, AL598336, AW976973, BU629726, AI433877. 
AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, BU684090, 
BF958121, BQ351941, AW194906, BG203580, BF078132, AW486134, 

15 AL600279, AA025538, AL600264, BF1 70676, BU759494, BB025236, 
BF214179, AI283076, BE694273, AI266380, BM670854, AA968415, 
BU503982, BB700612, BE988355, BU058357, BB312934, AW061311, 
BM537962, BE988356, BB318982, BB311217, BB557152, BB1 85248, 
BB557128, BB698742, BB 186736, AV345769, BB274293, BB632007, 

20 BB617958, AI391312, W18534, BB1 86581, BB311289, BB312835, 
AW347411, AA972439, BB263570, AU035125, BB277226, BB274224, 
BB268445, AW024037, AA025609, BB274174, R96089, BB272238, 
BB269037, BB385718, BE007324, BB325992, AJ275277, AI414381, 
BB125476, BB430961, BE232162, BQ121419, BQ121418, BG591509, 

25 BF457670, AL897593, AL897592, BM926692, BM538559, BI759567, 
AL601021, AL598780, AU222540, BG567619, AU166296, BF889835, 
AU164011, AV656025, BF343454, AW262441, AW237952 dans la base de 
donnees GenBank ; 

un fragment de Tun quelconque des sequences prece.- 
30 dentes, selectionne parmi les sequences representees dans la liste des 
sequences en annexe sous les numeros SEQ ID NO: 16 a SEQ ID NO: 30 ; 
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une sequence presentant un pourcentage d'identite d'au 
moins 80 %, de preference 90 %, apres alignement optimal avec I'une des 
sequences ou I'un des fragments precedents ; 

- les sequences complementaires des precedentes, sens ou 

5 anti-sens. 

8°) Polynucleotide ou fragment selon la revendication 7, 
caracterise en ce qu'il s'agit d'un polynucleotide variant de la sequence SEQ 
ID NO: 15ou 45. 

9°) Polynucleotide ou fragment selon la revendication 8, 

10 caracterise en ce qu'il s'agit d'un polynucleotide porteur d'au moins une muta- 
tion conduisant a une modification de la sequence en acides amines de la 
proteine correspondant a la sequence SEQ ID NO: 1 ou SEQ ID N : 46. 

10°) Utilisation d'un polynucleotide ou d'un fragment selon 
I'une quelconque des revendications 7 a 9 ou de I'une des sequences reperto- 

15 riees sous les numeros d'acces AK024730 et AK024812 et d'un des EST 
repertories sous les numeros d'acces BU1 98882, BM693711, AW372449, 
BM021380, BU928828, AL707573, AI885274, AI671785, AA805679, 
BU619959, BM021126, AL598336, AW976973, BU629726, AI433877, 
AV751613, BQ372751, AI827535, AI866257, AA843565, R96130, BU684090, 

20 BF958121, BQ351941, AW1 94906, BG203580, BF078132, AW486134, 
AL600279, AA025538, AL600264, BF1 70676, BU759494, BB025236, 
BF214179, AI283076, BE694273, AI266380, BM670854, AA968415, 
BU503982, BB700612, BE988355, BU058357, BB312934, AW061311, 
BM537962, BE988356, BB318982, BB311217, BB557152, BB185248, 

25 BB557128, BB698742, BB1 86736, AV345769, BB274293, BB632007, 
BB617958, AI391312, W18534, BB186581, BB311289, BB312835, 
AW347411, AA972439, BB263570, AU035125, BB277226, BB274224, 
BB268445, AW024037, AA025609, BB274174, R96089, BB272238, 
BB269037, BB385718, BE007324, BB325992, AJ275277, AI414381, 

30 BB125476, BB430961, BE232162, BQ121419, BQ121418, BG591509, 
BF457670, AL897593, AL897592, BM926692, BM538559, BI759567, 
AL601021, AL598780, AU222540, BG567619, AU166296, BF889835, 
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AU164011, AV656025, BF343454, AW262441, AW237952 dans la base de 
donnees GenBank ou de leurs fragments, comme sonde pour detecter, identi- 
fier ou doser des polynucleotides correspondants au polynucleotide selon 
I'une quelconque des revendications 7 a 9, particulierement dans d'autres 
5 organismes. 

11°) Utilisation selon la revendication 10, caracterisee en ce 
que la sonde est s6lectionnee dans le groupe constitue par les sequences 
SEQ ID NO: 15, 45 ou SEQ ID NO: 17 a SEQ ID NO: 44. 

12°) Amorce pour i'amplification des polynucleotides (ARN ou 

10 ADN genomique) correspondants au polynucleotide selon I'une quelconque 
des revendications 7 a 9, particulierement dans d'autres organismes caracte- 
risee en ce qu'elle est selectionnee dans le groupe constitue par les 
sequences SEQ ID NO: 31 a 43. 

13°) Polynucleotide susceptible d'etre obtenu par amplification 

15 & I'aide des amorces selon la revendication 12. 

14°) Methode de determination du profil de transcription du 
g£ne correspondant au polynucleotide selon I'une quelconque des revendica- 
tions 7 a 9 ou 13, ou d'une alteration dudit profil, dans un echantillon biolo- 
gique, comprenant une premiere etape d'obtention par tout moyen approprie 

20 des ARN totaux a partir de I'echantillon biologique, une deuxieme etape de 
mise en contact desdits ARN avec une sonde telle que definie aux revendica- 
tions 10 ou 11 prealablement marquee dans des conditions classiques 
d'hybridation entre les ARN et la sonde et une troisieme etape de revelation 
par tout moyen approprie des hybrides formes. 

25 15°) Methode selon la revendication 14, dans laquelle la 

deuxfeme etape est une etape de transcription inverse et/ou d'amplification 
des transcrits, realisee a I'aide d'une paire d'amorces selon la revendication 
1 2 et la troisieme 6tape est une etape de revelation par tout moyen approprie 
des acides nucleiques amplifies. 

30 16°) Methode selon I'une quelconque des revendications 14 

ou 15, caracterisee en ce qu'elle comporte en outre une 6tape devaluation du 
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taux de transcription du gene par comparaison a un temoin prealablement 
choisi. 

17°) Methode de mise en evidence dans d'autres especes du 
gene correspondant au polynucleotide selon Tune quelconque des revendica- 

5 tions 7 a 9 ou 13, ou de mise en evidence des variants alleliques dudit gene 
ou de mise en evidence d'une alteration fonctionnelle de ce gene, dans un 
echantillon biologique, comprenant une premiere etape d'obtention par tout 
moyen approprie de I'ADN a partir de I'echantillon biologique, une deuxieme 
etape de mise en contact desdits ADN avec une sonde telle que definie aux 

10 revendications 10 ou 11, prealablement marquee, dans des conditions 
classiques d'hybridation entre les ADN et la sonde et une troisieme etape de 
revelation par tout moyen approprie des hybrides formes. 

18°) Methode selon la revendication 17, dans laquelle la 
deuxieme etape est une etape d'amplification realisee a I'aide d'amorces 

15 selon la revendications 12 et la troisieme etape une etape de revelation par 
tout moyen approprie des acides nucleiques amplifies formes. 

19°) Methode selon Tune quelconque des revendications 17 
ou 1 8, caracterisee en ce qu'elle comporte en outre une etape d'isolement et 
de sequencage des acides nucleiques mis en evidence. 

20 20°) Trousse de reactifs pour la mise en ceuvre des methodes 

selon Tune quelconque des revendications 14 a 19 comprenant : 

- au moins une sonde telle que definie aux revendications 
10 ou 1 1 et/ou des amorces selon la revendication 12 ; 

- les reactifs necessaires a la mise en oeuvre d'une reaction 
25 classique d'hybridation entre ladite sonde et/ou lesdites amorces et I'acide 

nucleique de I'echantillon biologique ; 

- les reactifs necessaires a la mise en oeuvre d'une reaction 

d'amplification ; 

- les reactifs necessaires a la detection et/ou le dosage de 
30 I'hybride forme entre ladite sonde et I'acide nucleique de I'echantillon 

biologique ou des acides nucleiques amplifies formes. 
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21°) Vecteur de clonage et/ou d'expression dans lequel est 
insere un polynucleotide ou un fragment selon Tune quelconque des revendi- 
cations 7 a 9 ou 13. 

22°) Cellules hotes transformees, dans lesquelles au moins 
5 un polynucleotide ou un fragment selon Tune quelconque des revendications 7 
a 9 ou 13 ou au moins un vecteur selon la revendication 21 a ete introduit. 

23°) Organismes transg§niques non-humains, dont tout ou 
partie des cellules contient au moins un polynucleotide ou d'un fragment selon 
Tune quelconque des revendications 7 a 9 ou 123 ou au moins un vecteur 
10 • selon la revendication 20, sous une forme libre ou integree. 

24°) Organismes transgeniques non-humains selon la reven- 
dication 23 caracterises en ce qu'ils sont porteurs de cellules contenant un 
polynucleotide selon Tune quelconque des revendications 7 a 9 ou 13 non 
fonctionnel ou porteur d'une mutation. 
15 25°) Utilisation d'une cellule transformee selon la revendication 

22 ou d'un organisme transgenique non-humain selon Tune quelconque des 
revendications 23 ou 24, pour la production d'une proteine ou d'un peptide 
selon I'une quelconque des revendications 1 a 6. 

26°) Methode de preparation d'une proteine ou d'un peptide 
20 selon I'une quelconque des revendications 1 a 6, caracterisee en ce que Ton 
cultive des cellules exprimant la proteine ou des cellules transformees selon ia 
revendication 22 ou un organisme transgenique selon I'une quelconque des 
revendications 23 ou 24, dans des conditions permettant I'expression de ladite 
proteine, et que Ton purifie ladite proteine. 
25 27°) Proteine, caracterisee en ce qu'elle est susceptible d'etre 

obtenue par la methode de preparation selon la revendication 26. 

28°) Anticorps mono- ou polyclonal caracterise en ce qu'il est 
capable de reconnaitre specifiquement une proteine ou un peptide selon I'une 
quelconque des revendications 1 a 6 ou 27. 
30 29°) Anticorps selon la revendication 28, caracterise en ce 

qu'il reconnait, parmi les MAPs, uniquement et specifiquement la proteine 
ASAP de sequence SEQ ID NO: 1 ou SEQ ID NO: 46. 
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30°) Utilisation d'un anticorps selon Tune quelconque des 
revendications 28 ou 29 pour la detection et/ou la purification d'une proteine 
selon Tune quelconque des revendications 1 & 6 ou 27. 

31°) M6thode de detection d'une proteine selon Tune 
5 quelconque des revendications 1 a 6 ou 27, dans les cellules d'un echantillon 
biologique, comprenant 

une premiere etape de traitement convenable des cellules 
par tout moyen approprie permettant de rendre accessible le milieu intracel- 
lular, 

10 une seconde etape de mise en contact dud it milieu intra- 

cellulaire ainsi obtenu avec un anticorps selon Tune quelconque des revendi- 
cations 28 ou 29 et 

une troisfeme etape de mise en evidence par tout moyen 
approprie du complexe proteine ASAP-anticorps form6. 

15 32°) Utilisation d'un anticorps selon I'une quelconque des 

revendications 28 ou 29 pour la detection et/ou la selection de cellules 
pr6sentant des perturbations dans Torganisation du fuseau mitotique et/ou 
une induction des mitoses aberrantes et abortives liees a la surexpression de 
la proteine selon Tune quelconque des revendications 1 & 6 ou 27. 

20 33°) Methode devaluation in vitro de la capacite de prolifera- 

tion ou d'agressivite de cellules cancereuses comprenant 

une premiere etape de traitement convenable des cellules 
par tout moyen approprie permettant de rendre accessible le milieu intra- 
cellular, 

25 - une seconde etape de mise en contact dudit milieu intra- 

cellulaire ainsi obtenu avec un anticorps selon Tune quelconque des revendi- 
cations 28 ou 29, 

une troisteme 6tape de mise en evidence et de mesure 
par tout moyen approprie du complexe proteine ASAP-anticorps forme et • 
30 - une quatrieme etape devaluation du taux de transcription 

du g6ne par comparaison du taux de complexes proteine ASAP-anticorps 
form6s a celui d'un Echantillon biologique temoin pr6alablement choisi. 
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34°) Trousse permettant de mettre en oeuvre la methode 
selon Tune quelconque des revendications 31 ou 33 comprenant : 

- au moins un anticorps monoclonal ou polyclonal selon 
Tune quelconque des revendications 28 ou 29 ; 

5 - les reactifs permettant la detection du complexe proteine 

ASAP-anticorps produit lors de la reaction immunologique. 

35°) Methode de criblage d'une substance capable d'interagir in 
vitro, directement ou indirectement, avec le polynucleotide selon Tune 
quelconque des revendications 7 a 9 ou 13 ou la proteine ou un peptide selon 
10 Tune quelconque des revendications 1 a 6 ou 27, caracterisee en ce que : 

dans une premiere 6tape on met en contact la substance 
a tester et le polynucleotide ou la proteine et 

- dans une deuxieme etape on detecte par tout moyen 
approprie le complexe forme entre ladite substance et le polynucleotide ou la 

15 proteine. 

36°) Methode de criblage d'une substance capable de 
moduler I'activite de la proteine selon Tune quelconque des revendications 1 a 
6 ou 27, caracterisee en ce que : 

- dans une premiere etape on met en contact des cellules d'un 
20 echantillon biologique exprimant la proteine selon Tune quelconque des 

revendications 1 a 6 ou 27, avec une substance a tester, 

- dans une deuxieme etape on mesure par tout moyen appro- 
prie de I'effet de ladite substance sur I'activite de ladite proteine, et 

- dans une troisieme etape on seiectionne des substances 
25 capables de moduler ladite activity. 

37°) Proteine selon Tune quelconque des revendications 1^6 
ou 27 ou polynucleotide ou fragment selon Tune quelconque des revendica- 
tions 7 a 9 ou 13 ou anticorps selon Tune quelconque des revendications 28 
ou 29 ou vecteur selon la revendication 21 ou cellule transformee selon la 
30 revendication 22, utilise comme medicaments. 

38°) Utilisation d'une proteine selon Tune quelconque des 
revendications 1 & 6 ou 27 ou d'un polynucleotide ou d'un fragment selon 
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Tune quelconque des revendications 7 a 9 ou 13 ou d'un anticorps selon Tune 
quelconque des revendications 28 ou 29 ou d'un vecteur selon la revendica- 
tion 21 ou d'une cellule transform^ selon la revendication 22, dans la prepa- 
ration d'un medicament anti-mitotique. 
5 39°) Utilisation d'un polynucleotide ou d'un fragment anti-sens 

selon Tune quelconque des revendications 7 a 9 ou 1 3 ou d'un anticorps selon 
Tune quelconque des revendications 28 ou 29 ou d'un vecteur contenant un 
oligonucleotide anti-sens selon la revendication 21 et capable d'inhiber 
Texpression du polynucleotide selon Tune quelconque des revendications 7 a 
10 9 ou de la proteine selon Tune quelconque des revendications 1, 2 ,5, 6 dans 
la preparation d'un medicament destine au traitement des pathologies liees 
aux perturbations dans Torganisation du fuseau mitotique et/ou a une 
induction des mitoses aberrantes et abortives, liees a la surexpression de la 
proteine selon Tune quelconque des revendications 1 a 6 ou 27. 
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S644PCT88.ST25 
SEQUENCE LISTING 



<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 
GIORGI, Dominique 
SAFFIN, Dean-Michel 
ROUQUIER, Sylvie 

<120> Nouvelle proteine associee aux centrosomes et ses applications 
<130> S644PCT88 
<160> 53 

<170> Patentln version 3.1 

<210> 1 

<211> 647 

<212> PRT 

<213> Homo sapiens 

<400> 1 

Met ser Asp Glu val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
15 10 15 

Lys val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg ser Ala Arg Gin Arg Ser ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asd ser Asp Glu lie val ser Leu Gly Asp Phe Ser Asp Thr Ser Ala 
50 55 60 

Asp Glu Asn Ser Val Asn Lys Lys Met Asn Asp Phe His lie Ser Asp 
65 70 75 80 

asd Glu Glu Lys Asn Pro ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

ser Asn Gly Asn He Thr Lys Asp Glu Pro Val Cys Ala lie Lys Asn 
100 105 110 

1 
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Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp lie val val Lys Ser 
115 120 125 

Phe Ser Glu ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys He 
130 135 1^0 

Lys Met Lys Pro Lys Pro Arg lie Leu ser lie Lys ser Thr Ser ser 
145 150 155 iDU 

Ala Glu Asn Asn Ser Leu Asp Thr Asp Asp His Phe Lys Pro Ser Pro 
165 I 70 1/ - > 

Trp Pro Arg ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
K 180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu ser Glu Glu Leu Glu Leu His 
3 195 200 205 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe Ser Glu Asn Leu Asp Pro Glu Asp Ser Cys Leu 
225 230 235 

Thr ser Leu Ala ser Ser ser Leu Lys Gin He Leu Gly Asp Ser Phe 
245 250 25i 

Ser Pro Gly ser Glu Gly Asn Ala Ser Gly Lys Asp Pro Asn Glu Glu 
260 265 2/u 

He Thr Glu Asn His Asn Ser Leu Lys ser Asp Glu Asn Lys Glu Asn 
275 280 285 

ser Phe Ser Ala Asp His val Thr Thr Ala val Glu Lys ser Lys Glu 
290 295 300 

ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala Glu 
305 310 315 32U 

Leu He Met Asp Asp Asp Arg Thr val Asp Pro Leu Leu Ser Lys Ser 
325 330 3o:> 

Gin ser lie Leu lie Ser Thr Ser Ala Thr Ala Ser ser Lys Lys Thr 

- 340 345 . . 350 

lie Glu Asp Arg Asn lie Lys Asn Lys Lys ser Thr Asn Asn Arg Ala 
355 360 365 

Ser Ser Ala ser Ala Arg Leu Met Thr ser Glu Phe Leu Lys Lys Ser 
370 375 380 

2 
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ser ser Lys Arg Arg Thr Pro Ser Thr Thr Thr Ser Ser His Tyr Leu 
385 390 395 400 

Glv Thr Leu Lys val Leu Asp Gin Lys Pro Ser Gin Lys Gin Ser lie 
405 410 415 

Glu Pro Asp Arg Ala Asp Asn lie Arg Ala Ala val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn val Tyr Leu His Glu Met His Arg He Lys Arg 
435 440 445 

lie Glu Ser Glu Asn Leu Arg lie Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lvs Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met Lys 
465 470 475 480 

Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg Leu Glu Glu Lys 
485 490 495 

Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg Lys Gly Glu Ala 
500 505 510 

Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu Tyr Leu Lys 
515 520 525 

Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys Lys Gin Lys 
530 535 540 

Glu Glu Glu Thr val Ala Glu Lys Lys Lys Asp Asn Leu Thr Ala Val 
545 550 555 560 

Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin Lys Lys Lys 
565 570 575 

Glu Lys lie Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys 
580 585 590 

Lys Asp Lys Asp Lys Gin Ala lie Asn Glu Tyr Glu Lys Trp Leu Glu 
595 600 605 

Asn Lys Glu Lys Gin Glu Arg He Glu Arg Lys Gin Lys Lys Arg His 
610 615 620 

ser Phe Leu Glu ser Glu Ala Leu Pro Pro Trp Ser Pro Pro ser Arg 
625 630 635 640 

Thr Val Phe Ala Lys val Phe 
645 
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<210> 2 

<211> 25 

<212> PRT 

<213> Homo sapiens 



<400> 2 

Met ser Asp Glu val Phe ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
15 10 15 

Lys val Thr Lys Arg Thr Thr Phe Gin 
20 25 

<210> 3 

<211> 28 

<212> PRT 

<213> Homo sapiens 

<400> 3 

Asp Glu Leu lie Arg Ala lie Thr Ala Arg Ser Ala Arg Gin Arg ser 
15 10 15 

Ser Glu Tyr Ser Asp Asp Phe Asp Ser Asp Glu lie 
20 25 

<210> 4 

<211> 107 

<212> PRT 

<213> Homo sapiens 



<400> 4 

val Ser Leu Gly Asp Phe Ser Asp Thr Ser Ala Asp Glu Asn Ser Val 
1 5 10 15 

Asn Lys Lys Met Asn Asp Phe His He Ser Asp Asp Glu Glu Lys Asn 

;• .20 25 30 

pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys Ser Asn Gly Asn He 
35 40 45 

Thr Lys Asp Glu Pro val Cys Ala lie Lys Asn Glu Glu Glu Met Ala 

50 55 60 

4 
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pro Asp Gly cys Glu Asp lie val val Lys ser Phe Ser Glu ser Gin 
65 70 75 80 

Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie Lys Met Lys Pro Lys 
'85 90 95 

pro Arg lie Leu ser lie Lys Ser Thr Ser Ser 
100 105 

<210> 5 

<211> 76 

<212> PRT 

<213> Homo sapiens 



<400> 5 

Ala Glu Asn Asn ser Leu Asp Thr Asp Asp His Phe Lys Pro ser Pro 
1 5 10 15 

Trp Pro Arg ser Met Leu Lys Lys Lys ser His Met Glu Glu Lys Asp 
20 25 30 

Gly Leu Glu Asp Lys Glu Thr Ala Leu ser Glu Glu Leu Glu Leu His 
35 40 45 

Ser Ala Pro ser ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
50 55 60 

Glu Lys Lys Ala Phe ser Glu Asn Leu Asp Pro Glu 
65 70 75 

<210> 6 

<211> 31 

<212> PRT 

<213> Homo sapiens 

<400> 6 

asd ser cys Leu Thr Ser Leu Ala ser ser Ser Leu Lys Gin lie Leu 
1 5 - 10 15 

Glv asd ser Phe Ser Pro Gly ser Glu Gly Asn Ala Ser Gly Lys 
20 25 30 

<210> 7 
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<211> 83 

<212> PRT 

<213> Homo sapiens 

<400> 7 

Asp Pro Asn 61 u Glu He Thr G"lu Asn His Asn ser Leu Lys Ser Asp 
1 5 10 15 

Glu Asn Lys Glu Asn ser Phe Ser Ala Asp His val Thr Thr Ala val 
20 25 30 

Glu Lys Ser Lys Glu ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu 
35 40 45 

Lys Ala Lys Ala Glu Leu lie Met Asp Asp Asp Arg Thr Val Asp Pro 
50 55 60 

Leu Leu Ser Lys Ser Gin ser lie Leu lie Ser Thr Ser Ala Thr Ala 
65 70 75 80 

ser ser Lys 

<210> 8 

<211> 24 

<212> PRT 

<213> Homo sapiens 

<400> 8 

Lys Thr lie Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn 
1 5 10 15 

Arg Ala ser ser Ala Ser Ala Arg 
20 

<210> 9 

<211> 54 

<212> PRT 

<213> Homo sapiens 

<400> 9 

Leu Met Thr Ser Glu Phe Leu Lys Lys Ser ser Ser Lys Arg Arg Thr 
1 5 10 15 

6 
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Pro ser Thr Thr Thr Ser ser His Tyr Leu Gly Thr Leu Lys val Leu 
20 25 30 

Asp Gin Lys Pro Ser Gin Lys Gin Ser lie Glu Pro Asp Arg Ala Asp 
35 40 45 

Asn lie Arg Ala Ala val 
50 

<210> 10 

<211> 32 

<212> PRT 

<213> Homo sapiens 



<400> 10 

Tyr Gin Glu Trp Leu Glu Lys Lys Asn Val Tyr Leu His Glu Met His 
1 5 10 15 

Arq lie Lys Arg lie Glu Ser Glu Asn Leu Arg lie Gin Asn Glu Gin 
20 25 30 

<210> 11 

<211> 54 

<212> PRT 

<213> Homo sapiens 



<400> 11 

Lys Lys Ala Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp 
15 10 15 

Lys Ala Met Lys Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg 
20 25 30 

Leu Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg 
35 40 45 

Lys Gly Glu Ala Leu Gin 

50 . . 

<210> 12 
<211> 49 
<212> PRT 
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<213> Homo sapiens 



<400> 12 

Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu Tyr Leu Lys Glu Lys 
1 5 10 15 

Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys Lys Gin Lys Glu Glu 
20 25 30 

Glu Thr val Ala Glu Lys Lys Lys Asp Asn Leu Thr Ala Val Glu Lys 
35 40 45 

Trp 



<210> 13 

<211> 43 

<212> PRT 

<213> Homo sapiens 

<400> 13 

Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin Lys Lys Lys Glu Lys lie 
15 10 15 

Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys Lys Asp Lys 
20 25 30 

Asp Lys Gin Ala He Asn Glu Tyr Glu Lys Trp 
35 40 

<210> 14 

<2U> 41 

<212> PRT 

<213> Homo sapiens 

<400> 14 

Leu Glu Asn Lys Glu Lys Gin Glu Arg He Glu Arg Lys Gin Lys Lys 
1 5 10 15 

Arg His ser Phe Leu Glu Ser Glu Ala Leu Pro Pro Trp Ser Pro Pro 
20 25 30 

Ser Arg Thr Val Phe Ala Lys val Phe 
35 40 
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<210> 15 

<211> 2575 

<212> DNA 

<213> Homo sapiens 

acttccttcg tctgggtggt tgccccagcg acacgttggg ccgaagagcg gtgttgggta 60 

cccgagagac ccggcggtgg ggaagtcact tcctcccgaa gacgctgttt cctagcaacc 120 

gccctccgcc tctgttatta gcccctcctc ctcgctcggt ccaggaccgg ctctgcgggc 180 

gccgccaggc ccagaccaag ctactatcag aagttgaatt ctaataatta gctattttat 240 

aaaggtaacg agaaaaaata cactatgtct gatgaagttt ttagcaccac tttggcatat 300 

acaaagagtc caaaagttac caaaagaact actttccagg atgagctaat aagagcaatt 360 

acagctcgct cagccagaca aaggagttct gaatactcag atgactttga cagtgatgag 420 

attgtttctt taggtgattt ttctgacact tcagcagatg aaaattcagt taataaaaaa 480 

atgaatgact ttcatatatc agatgatgaa gaaaagaatc cttcaaaact attgtttttg 540 

aaaaccaata aatcaaacgg taacataacc aaagatgagc cagtgtgtgc catcaaaaat 600 

gaagaggaaa tggcacctga tgggtgtgaa gacattgttg taaaatcttt ctctgaatct 660 

caaaataagg atgaggaatt tgaaaaagac aaaataaaaa tgaaacctaa- acccagaatt 720 

ctttcaatta aaagcacatc ttcagcagaa aacaacagcc ttgacacaga tgatcacttt 780 

aaaccatcac cttggccaag gagtatgtta aaaaagaaaa gtcacatgga ggagaaggat 840 

ggactagaag ataaagaaac tgccctcagt gaagaattgg agttacattc tgcaccttct 900 

tcccttccaa cgccgaatgg catacaatta gaagctgaga aaaaagcatt ctctgaaaac 960 

cttgatcctg aggattcatg cttaacaagt ctagcatcat catcacttaa acaaattctt 1020 

ggagattctt tttcaccagg atctgaggga aacgcatctg gaaaagatcc aaatgaagaa 1080 

atcactgaaa accataattc cttgaaatca gatgaaaata aagagaattc attttcagca 1140 

gaccatgtga ctactgcagt tgagaaatcc aaggaaagtc aagtgactgc tgatgacctt 1200 

gaagaagaaa aggcaaaagc ggaactgatt atggatgatg. acagaacagt tgatccacta 1260 

ctatctaaat ctcagagtat cttaatatct accagtgcaa cagcatcttc aaagaaaaca 1320 

attgaagata gaaatataaa gaataaaaag tcaacaaata atagagcatc cagtgcatct 1380 

gccagattaa tgacctctga gtttttgaag aaatctagtt ctaaaaggag aactocatcg 1440 

acaactacct cttctcacta tttagggact ttaaaagtct tggaccaaaa accttcacag 1500 

aaacagagca tagaacctga tagagcagat aacataaggg cagctgttta tcaggagtgg 1560 

ttagaaaaga aaaatgtata tttacatgaa atgcacagaa taaaaagaat tgaaagtgaa 1620 

aacttaagga tccaaaatga acagaaaaaa gctgctaaaa gagaagaagc attagcatca 1680 

9 
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tttgaggcct 

cttgaagaaa 

ctacaagctt 

aaggagagag 

aagaaagata 

caaaagaaaa 

aaagataaag 

caagaaagaa 

cctccgtgga 

ttacattatt 

tatttatagt 

gaaatacttt 

aacaaagacc 

ctgataattc 

aagtatattt 



ggaaggctat 

aaaacaagaa 

ttgaaaaatg 

aatatgaaag 

atttaactgc 

aagaaaaaat 

ataaacaagc 

ttgaacgaaa 

gccctccaag 

tggttattta 

tagaggaata 

ggaatgtaat 

taataatcag 

ttatggtgga 

aattccagta 



gaaagaaaag 

gaaaactgaa 

gaaagagaaa 

agcaaagaaa 

tgttgagaaa 

aaatgagaaa 

tattaatgaa 

acagaagaaa 

cagaactgtg 

tcggtttgcc 

tattttaatt 

cagtgaaagc 

attgttttta 

gtgattcatg 

ataaaaagga 



S644PCT88.ST25 
gaagcaaaga aaatagctgc 
gaagaaaatg ctgcaagaaa 
aagatggaat atcttaaaga 
cagaaagagg aggaaactgt 
tggaatgaaa aaaaggaagc 
agaaaggaag aactgaaaag 
tatgaaaaat ggctggaaaa 
cgtcattcct ttcttgaaag 
ttcgcaaaag tgttttgata 
aatattagcc atagatttaa 
aaatgccaga cactcctgct 
atttttttga actgtagata 
ccattaagat acataagatt 
atctttttca ttaagctctg 
aatcatctag gtaccataaa 



caaaaagagg 

aggagaagca 

gaaaaataga 

tgccgagaaa 

ttttttcaag 

agctgagaaa 

taaggaaaaa 

tgaggcactt 

attctagttc 

accattcaat 

gacaatgaaa 

aactgcctca 

ttatcatgtc 

tatgttattt 

aaaaa 



1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2575 



<210> 16 

<211> 29750 

<212> DNA 

<213> Homo sapiens 



tctgggnggg agttgggcgg gtcctgtctc ctaggcaaca gcacatgcac acaagcgacc 60 

aataatgagc ccctctccaa agacccagga aggtgatgtc acttccttcg tctgggtggt 120 

tgccccagcg acacgttggg ccgaagagcg gtgttgggta cccgagagac ccggcggtgg 180 

ggaagtcact tcctcccgaa gacgctgttt cctagcaacc gccctccgcc tctgttatta 240 

gcccctcctc ctcgctcggt ccaggaccgg ctctgcgggc gccgccaggc ccagaccaag 300 

gtgagcagct cctacccgat gcttggctct tgattctcag ggtcgcggag aactggccgc 360 

gggcgtccgg ggccgggaac agaaagcggg acctgggggc catgggggat ccggacagag 420 

accgcgcttg gacgtgcacg ggcctggcgt tcgctggtgc tcagcatacg gcgcggtgag 480 

gagcggcgag cacccggacg tcacctggcc tggtagggaa cggaacccgg ggcgcacaac ~ 540 

gctatgggcg gccctgccag gcctctgctc cgagtacggg aaaccgcgat tttaatgcgg 

ctcatcgcga aagcttcgtc gttttgtctg gctctcttta acacttttgt gagaggaaaa 

attggcttgc aatacatctc gctggctgtt tgcgggttag cattacgatc tttttctttg 720 

aatagcgctg tatgcaaata tatagataca tttttttttt ggtggtggtg ctcataattt 780 

10 
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ttacgccgac 
gttatacttt 
cgtattaact 
ataacttcca 
agaacctttt 
tgtggggaga 
gttttgtata 
gtaacgagaa 
agagtccaaa 
ttcacagtgt 
taaagcaggg 
catccagtat 
gtttcctact 
tttttttctg 
aactcagcct 
agctcttaaa 
tgagcccctt 
ataatgtgtg 
tgctctgcat 
atatttgtta 
ttaaagaatt 
tcatttcagg 
gaatactcag 
cacttttctt 
cctcaatcac 
ttaattagta 
ttgttttgtt 
aaaaggatgg 
ccctaggagg 
ttagaagtgc 
aaatttaaaa 
tcttagctat 
cttggtgttt 
ctggagtgca 



gatccttttg 
agaagagagg 
tgtaatcatt 
tttgaatttt 
taagtgaaga 
gtagaatcaa 
tttcagctac 
aaaatacact 
agttaccaaa 
aaacactgta 
gtaaatctta 
tacaaactcc 
aagttaaaag 
ttgtaacata 
ctaagtttgc 
aataccaatt 
cttatttgtt 
tctcctctag 
tgagtatgag 
gatgaatgaa 
acttgtgaat 
atgagctaat 
atgactttga 
ctttttgctt 
gtatgttaaa 
gaaagccact 
ttctgaatgt 
ctgccagtgg 
tgctacagct 
ttttataaag 
accacagact 
gtaaacatat 
ttgtttgttt 
gtggtgcaat 



atggcctttt 
tgaaaaataa 
tatttgcaga 
tttaaacaag 
tgtagcccaa 
atgtaataaa 
tatcagaagt 
atgtctgatg 
agaactactt 
ttagatgggt 
tattactttt 
cctatatggt 
ttgaatcgca 
atgtttaagt 
aatattgatt 
tctttcaaaa 
accctccagc 
ttaaactgcg 
gcgtaaagtg 
acctaagttt 
atgatacctc 
aagagcaatt 
cagtgatgag 
ccttagtttt 
ataataccta 
cttaattttc 
gtatacgaaa 
taaaccacat 
agttagtaac 
cttgctataa 
cttcgtgttt 
taacatttta 
gtttttgttt 
ctcggctcac 
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aaataagacg tgacttattt 
ggtgttctat tttaattggc 
ctttttaagt agttgcaaaa 
cttgttatga gaatttgcta 
tgttcatatc agatgctttt 
ataaattctg aagcatgcga 
tgaattctaa taattagcta 
aagtttttag caccactttg 
tccaggtaaa gtatttttat 
tgaaattggt gattctagaa 
gaggttttgc acatgatcat 
tttaagacta ccaaagtagc 
accttaaatt gccattttta 
ttttttttct gttgagtcac 
gcatccattt ctgaaatatg 
taccagtttt taataaatta 
tctaattata acctgcaatt 
agctccatga ggaagggctc 
ggtacatggc ataaagtgag 
gaaagcagtc gttaatcaag 
catgtttgga tggaaattga 
acagctcgct cagccagaca 
attggtatgt gacagtatgg 
gtatttagcc agccccccaa 
agcattcact aattttagat 
aggaagttgt atgattttct 
atataaatta attgatggca 
tgaagaagac aggttcatct 
tagtcccaca gaactaaact 
atcagatttt ttttggctgt 
catatatcag tactattata 
gtttcaggta taagcataca 
ttgagatgga gtctcgctca 



tgcaacctcc acctcccagg 
11 



tgaaggcaat 
agcattttgt 
ctattttagg 
tttctttaca 
ctttgacctt 
agtctgattt 
ttttataaag 
gcatatacaa 
ttggaatcat 
cagtcctata 
gtttgggctc 
ctcaatacta 
tataaaaact 
tgcaattttg 
ccgagacaaa 
taatctaaat 
aatttgttcc 
ttgtctgtga 
cttgcaggaa 
cattgtttgt 
tttcagtatc 
aaggagttct 
aaacgtgaac 
ccacccatcc 
tttcaacttt 
ttttttattg 
ggtttgcagt 
ttaagatcaa 
tcggtgcaca 
gataaggggt 
atttggtttc 
gaattctaaa 
gttgctcaag 
ttcaagtgat 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580. 
2640 
2700 
2760 
2820 



WO 2004/058815 



PCT/FR2003/003895 



S644PCT88.ST25 

tctcctcctt cagcctcctg agtagctggg actacaggtg cccgccacca tgcccggcta 

atttttgtat ttttagtaga gatggggttt caccacatcg gccaggctgg tctcgaactc 

ctgaccttgt gatccgcccg cctcagcctc ccaaagtgct gggattatag gtgtgagcca 

ccgcacccgg cctggtgttt tattctttaa aatttggtga ataattgtaa ttgatttctg 

taaaaccagt aataaccaca gttaaatcac tgctgtatag ttaacttagc atttcttatg 

attcttagta aatctaatat tctggtgtgg atggaattgt agttccaaaa tttttatgga 

aaaaatataa ttagtaatta ctaattaaat tcttccattt acaaatgttc ttgattttac 

atgaagaagt aatttgcaaa taaaagtttt acagtccata atctaattta aatgctacat 

gactgattgt tagggacctt tggatggctt tttccagagc aaacagtgtt tggttgtttg 

gtaccctaca gacaacacaa taaatacatt ttgaataaat taatgaaatt ggaattttta 

tttcataaat gttaatgaga cgtgcctgag ttagctgtgt ttttagagct gcaagtctat 

ttataaaata catttgtgcc tattcattgt tagaattttg tttgtagctt ttaaggtaaa 

ctttgattaa gttaacgtaa ccttgacaat ttttaaaaat actgttgaaa acatttttct 

tttccatttt tcagtttctt taggtgattt ttctgacact tcagcagatg aaaattcagt 

taataaaaaa atgaatgact ttcatatatc agatgatgaa gaaaagaatc cttcaaaact 

attgtttttg aaaaccaata aatcaaacgg taacataacc aaagatgagc cagtgtgtgc 

catcaaaaat gaagaggaaa tggcacctga tgggtgtgaa gacattgttg taaaatcttt 

ctctgaatct caaaataagg atgaggaatt tgaaaaagac aaaataaaaa tgaaacctaa 

acccagaatt ctttcaatta aaagcacatc ttcaggtaat ttgttaggat tactgtaatt 

gcatttcttg gaagtttatt ttaagataat cagtcccaaa atttttatat ggtagctagt 

atatatttaa gaaaaaaaga cagacttaac ttccatttta cagacctgtt gtattttgtc 

taacttcaat tttacagacc tgttgtattt tgtctaactt caattttaca gacctgttgt 

attttgtctt gcatctaggc tgttgcctga tagaaagcca aagcacaaag ccaaagcacc 

tttagtcatc catagcatcc atagctgtgg atctccagac acctagacct gtgagcttca 

gttttgtttg taggtgtgga actggaatgg aatgctgtct aatccctctc acactccaaa 

gattagagtt acagcaatat tgagactaat ccttctaaca gtctttgcca taccaacatt 

gtgccagaaa attttcttga catttgtata tttgaaggat gagttatgtt attgctgctg 

ttgtttgttg aagcatccag gcactcctta agagaatctc catttgatct ctgtattgcc 

tatgaaaatc tactaagatt cagttttcca aaggaaagtt cctggtgtga tctgggatta 

cagttagttc tgcccacaat tttactgaat tttaagcata aaggaacaaa gatagaatga 

aacggagacc aagtcctgtc acataccctg ggccaccatt catgaacttg tatatgcaag 

gttaaggatt ttttgttttt cattctttgt attttataaa ggaattatta gttgatgtta 

accttcataa aaatctcctt gcatatcatc agtaaataca gtgctggtaa atatttcata 

ctttgcatat tagataccag tggtaacgtc agacaaaact ttatttcagg catgtattgg 
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ggaactgctc 
taagcagagc 
ttatatatga 
ataaccctct 
ataaaaaact 
ccttctaagt 
ttattaagaa 
tataattaga 
aaaaaaaaaa 
aaggtggcat 
taatataaaa 
tttcttaaag 
gaatttttgt 
aaattgaggc 
aaattaatat 
taaattcttt 
gagatattgc 
tgtccttgct 
gacagttgct 
catgactgaa 
cctgctagag 
aaaacgggat 
ttgaagtgct 
attttattat 
gggatgcgta 
ttgcactgaa 
aattgactca 
agacatgcaa 
agcttaggta 
aactgttagc 
aggacaaaac 
ggattggatc 
ggattttgta 
agggatgtag 
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ctttcttcct gaccccacaa tctcattaac tttgaaatga gcaaaggatg 
aaagaacact agaataatat ccaggacact gggggaaagg cctctgtata 
cttcagcaaa taagttaagc ttcagtatcc tcatgatgag gaagctaaaa 
ttctattcct gcaaaattgt gagagtttat tgaagtgcat ctcataaact 
acaaaaatgc aaacagatgc ataatgaaac aattaacttg ttaaaatgta 
atagtgagtg aaatcaatgc tggagagaag aggaacataa ttgaacttcg 
aatgcgagca tatatagcaa ctaaaaattt gtctgagaca ggtggatgta 
agtttatggt agataatcag gaaagcaata atccacctat ttcatacctt 
aaaacctgtg gtgggttaca atgaataaga aaatactgta ttttaaccac 
caggatccta aatgctctac ttatatatgc aatgttatat tcagtacgtg 
ataattacct aaataggtaa ttgtatacat tgattaccaa aaaaagcgct 
tataggcatt tttttttctt tttgggaact tgacagtact tctggaagtg 
agaaaatata ttaaagttgt cattctcagg ttcttcaggt tgaaaagtaa 
tagtgttcct aagataatat ctggcatata taataagtat ttaaatgaat 
atgaatgatt tatctttgaa agagggaata tggttcatga gtttatcctc 
gacttttttt ttttctgtac aggtttggaa ctcaatgttt ttaatgtggt 
tgagtagcaa gtaatgcttt atgaaactat tagagcttga aggttttctc 
tgtcttttgt aaaaagtata ataaccagac tttatagtca ctactgaagt 
ctataaagtg aaagtatttt tcacaggata tgtttttatt ttaatactaa 
atcatgaact ttggagtcag gatgcttctc ctttaatctg agatctgcag 
tttgtgactt tgggcatgag acctctttgt tctcatttta ttcatcttta 
aatagttgcc tgcctctagg agtttgaggc aattaaatga gttcacatat 
tagaatagta ctggcataaa tttagcactc tataaatgtt ctgattattc 
ttagcgtttg tttataaaca tgctcagcag gtataaagta tcagtcatgc 
agttctagag atctgctgta cattgtgcct atagttaaca gtactgtctt 
tgtattaaga aggtagatct catgtttgtt cttaccacaa taataaaaaa 
acaccttctt tcaggcatta tataatattc tgcttaaact gaggctcaaa 
gcatttgtca ggaggagaag caggaagtgg atattctagg cagggggatc 
aaggtatggt agcaggaggg attggaggga ttgtggtatg tgtgcatgac 
ccagcatttc agaaacacag atgacaaaat ggctgtagat aaggcagtga 
cataaaatcc gttttatgtt gtttaaaggc agttaagctt ttattctgta 
atggggagcc attgaataat tttgtagaaa ggagtgatgt gatctgattt 
aatatcatgg aagcagtgat: ctaggaaaga gtggataagg acccgacagc 



aaagtggaat aaatgagata tttggcaatt agaattgata ggatatattg 
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atactctgga 
acatttggct 
tggtatggtt 
aagatgttaa 
ataaatatgt 
tgtttcgaat 
aaagagtgaa 
aaaagattcc 
tctttgtcct 
aaaatcaacc 
gtaacgtgta 
ggtagaaact 
ttataagagt 
aactgtttct 
ttagatggat 
gctcactgca 
gctgggatta 
cagggtttca 
tcggcctccc 
acaggcgtga 
gagctctgta 
gggcataggc 
tttttttata 
agatgatcac 
ggaggagaag 
ttctgcacct 
attctctgaa 
tgaatttatg 
tgtgtgtgtg 
actgtattcc 
cactaaggaa 
atccagtttt 
tgtttatctt 
gaacaatata 



tttaggggat 
ggagtttagg 
gtggaatctt 
ttagaccaat 
atagcaggta 
actggatgca 
attttaataa 
ttcctctaat 
tataatagca 
tgtaaagtac 
cagggcttgg 
ggggcaagat 
tcacaatgtt 
ttactttgtt 
ttttgctctt 
acctcagact 
caggcacgcg 
ccgtgttagc 
aacgtgctgg 
gccaccgcgt 
tagagaagag 
acaggaggga 
cacacacttt 
tttaaaccat 
gatggactag 
tcttcccttc 
aaccttgatc 
cttttttatc 
ttttacatac 
accgagtcta 
gaaggaaatg 
agagaaagta 
taataatttt 
gtcagtgtca 



aatagaggga 
atgtagctaa 
ctggcagaat 
tttgaagttg 
aaatgcaggc 
aatcagcatt 
atgctaaaga 
gagagttagc 
cttataatct 
ctggacaggt 
tactcaaagg 
tttgttttgt 
gaagagttaa 
ttttttttgt 
attacccagg 
cctgggttca 
ctactaagcc 
caggctggtc 
gattacaggc 
ccggcctgat 
ttgtgggctt 
agtatggtag 
aagcatttta 
cacctcggcc 
aagataaaga 
caacgccgaa 
ctgaggttag 
tgattatgaa 
tttcttctgc 
aaactgcatc 
catccaatta 
aaatgtcaaa 
ttaaatttat 
ttttatttat 
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ggaatctaga gcccttggat 
aattgtcagc tacttataat 
ccataagccc atttttaggt 
agaaaaatgc atttgtagaa 
aaaaaatata tacatggaaa 
tgattcttga tttaaactta 
agttttatgg actcagaaca 
actcctatcc cttgagtgcc 
tagtaatcta gtcttgtaat 
ccattgccgc tttgttgatt 
cttgatggat gagcctcctc 
ttttttattt ttaacatttt 
cttcttgtga ctggttactt 
tgttgttgtt gtttggtttt 
ctggagtgca gtggtgtgat 
agcaatcctc ctgcctcagt 
cggctaattt ttttgtattt 
tcgaactcct gacctcatga 
gtgagtcacc gctcccaaca 
tattaaccat catttatttg 
catctggact cttcaggaca 
cacccagaga gatagataaa 
tttttcagca gaaaacaaca 
aaggagtatg ttgaaaaaga 
aactgccctc agtgaagaat 
tggcatacaa ttagaagctg 
cactaccact aaactgrtga 
aaagagaagg agagaatgaa 
aactgataag gaaataattt 
aattgtaaga cgtagcatta 
aactataaca caccagtgat 
aagtgttgct tttctgaatc 
gtatctttga attatgtaat 



ttgattttat tcactcaaca 
14 



ttggggttga 
aataccaatt 
aaatgggagg 
caatagaaac 
gtcttcccat 
gaagtaatgg 
attaactcat 
aacatcatca 
tttgtttaga 
atgaggttta 
attttatagt 
ttttttaata 
tcaggatgac 
tttttttttt 
ctcgatctcg 
ctcctgagta 
ttagtagaga 
tctgcccacc 
tgtcgggatc 
tgccttacta 
gagaacaaag 
gccatggtca 
gccttgacac 
aaagtcacat 
tggagttaca 
agaaaaaagc 
attgtgttct 
tttgtgtgcg 
ttaaaaatac 
. ttttacatac 
tgtagagttt 
tatataatag 
ttatggctaa 
aatgtgtgtt 
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gaatgttca't ggcactcttc tgtgttcttt gggttatgtt ccaatagcat taaatgtggc 9000 

ctttcaggtt tccatcaggg aatttactat gcattgttat taagggagaa cacttcgttt 9060 

ttctctttgt atttcactat gagaagcaaa ctgtcccttc tgaacatttc agaagggaaa 9120 

agtacaggaa gaacatttct tccccataat ctgcttgggc agattaggga actgcatgcc 9180 

acctggccaa gcttctttct ttttctcatc gcttgtctgc agtgttggtg cttaaggatc 9240 

tgctctctgg gaggtgaggc agaaggtgct gagaggagct cttttgtgca atgactaaat 9300 

gggggaatcc ccctaattca gactggaagt attaggaagc acaataggct accaattcaa 9360 

atcttgttct gcagttgagc tttaccagta aagctgacaa tttgatatac gcctaactga 9420 

caccaccatg ctgtttctta atttgttctg aaaaccagaa gaagaaaccc aagcaaatac 9480 

tttatattta agaaaattat ctgatccatt gaatattgtg ctagtttctt gtagctgctg 9540 

taacaaattg ccacaaactg gttaacttaa aacaacagaa atgtattctc ttagttctgg 9600 

aggtcagaag tccaagatca aggtgtttgc agggccattt tcctctgaag gcatcacgga 9660 

agaatccttc cttgcctctt ccagcttctt tctagtggtt gccagcagtc catggcattc 9720 

cttggcttgt agctggcttg tagctgcatc attcccttct ctgccttcat cccatgtggc 9780 

cttcttccct gtgttttctc tgcatgtctg tgtctcttct ttctcttaaa aaaagacacc 9840 

aggcattgga tttagggccc accctaattg agtgtgtcct catcttatct atttaaagct 9900 

gtaaacacct tatttcctaa gaaagtcgta ttttgaggtt ctggatgaac atgaattttg 9960 

gggcattaat gttcgtatgt taaacctagc attcccggga taaactctgg ttagtcatgg 10020 

tgtgatattt tattgtggga tgtgatttgt taaaattgtg ttaaggtttg catctatatt 10080 

tatgaagtct attggtctgt aatttttttc ttataatgtt accatcaggc ttgggtatca 10140 

aatgagttgg ggagtgtctt ttcttcattt tataaaagtt tggtatcatt attttcttaa 10200 

atgagaggat tcaccagtac aattatctgg gcctggaatt ttctgtgtgg agacatcttt 10260 

ggcattacat ttgatttttt aaataggtat ttcagtactc acattttctg ttttgccagt 10320 

ttggtaattg tgtctatcaa gaagtttgtc catttcatct gatatgttga gtttataaac 10380 

agagttgttc acgatagtcc ctcattcttt tgatgactag gattatcatg acatttcatt 10440 

tttatttcta acatatataa tttgtgtttt gtgtctttcg tgctaaatct tgataggcat 10500 

tgcttagttt tattaaacgt ttttaagaac cacttcggct ttgtcatatg ttggtgcaaa 10560 

agtaattgca gttttggcca ttactttcaa tgacaaaaac cgcaatcatt ttgcaccaac 10620 

ctaataattt tctctattgt ttgtttaatt gattttcagt attatttcag tattattcag 10680 

tattatttct tttactttct tttttttttt ttgagacaga gtctcgttct atcgcccagg 10740 

ctggagtgca gtggtgcaat cccagctcac tgcaagctct gcctcccagg ttcactccat 10800 

tctcctgctt cagcctcccg agtagctggg actacaggca cccaccacca tgcctggcta 10860 

atttttgtat ttttagtaga gacggggttt caccgcgtta gccaggatgg tctcgatctc 10920 

ctgacatcgt gatccaccca cctcggcctc ccaaggtgtt gggattacag gcgtgagcca 10980 
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cggcgcctgg cctcttttac tttcttttgg tttaatttgc ttatctttag atttgaaaat 11040 

tttctcattc atttttaaga ttttcgtgat ttctgctaaa cctgttgaaa ggtgtaaact 11100 

ttcttctttg tactgcttta gtggccccga ttttttgatg ccttttattt ttattatcat 11160 

ttctttaaat atatatttta acttcccttg tgatctcctg ttttaaaaat ttattttttt 11220 

agttgaaaaa taataattgt acatggggta catagtgatt tttcgataca tataatatat 11280 

agtgatcatt gtgatctctt ttttgaccag ttggttattt tatggtgatt tattttattt 11340 

tcaaatactt gttttttctc tagatatact tttgatgtta attataagtt aattttgttg 11400 

tagtctagag aatgtatctt acatgatttc aaatttttaa aaattattat tattatttct 11460 

aaatggccca gctttagtgt atcttgtgaa agtctcattt gcatctgcaa agtagatgtg 11520 

ttctccaggt gttgaatata atgttgtata atttaagttt ggtcaacatg gttggtaata 11580 

tcattcagat cttctttatc cttactgatt tttcatccaa tttgtttacc cgttaccaac 11640 

ttaggggtat taaaatatcc agttatgttt gtgggtttgt ttatacttct ctttagttct 11700 

gtcagtattt tataactttg ttatcaggca catacacatt tattattatt atgttttgag 11760 

cattatgaaa cgtctctacc tctggtaata ttcctttcct tatcttatag attgttttgt 11820 

gtaatacttc agctttctta tgacaagtgt ttccatggta tatgctttct atcttttttc 11880 

tttcaaacta attctgtctt ttcatgtaag tgaatctctt acaataagag tttggtgtca 11940 

cttttttatt aagtctgaca atctatgcct tttaatgtag tgtttagtcc atttatgaat 12000 

gttttgtcca tttaatgtaa atactgctat gattggattt aggagcaatt tgttgctctt 12060 

tattttctat ttatctgttt tttaaaatta ttgtttttat tgttgtttct ctgttactcc 12120 

tttcttgcct ttttttgagg agataatcat gaatctttta gttttttatt attattgacc 12180 

ttttatctat atttgtttgc attgtatttc tcagagttga tcagtggatt acagaatata 12240 

tctgaaaatt atcacaatct atttagaatt gatattgtat tgtttcacat ttgatctaga 12300 

aaccttggaa taatatagtt ccatatactc cctcatccat tgtgctattg tcatatatta 12360 

tatctacata tcctataatc cccacaatag agttataact ttttcttaaa gagccctttc 12420 

agttttttgt attagacttt taaaaaatta aagaaggcta gaataaatat atattatata 12480 

tctactgtat tatatattgt atatattata gataacattc tattgctaaa tatagataat 12540 

atatatttgt agacaatatc tatatatagg taatatatat tctattctta tatattatat 12600 

agatatataa catctatata atctatttat agatattaca tatctataaa tacatataca 12660 

atttctaggg atcttcattt cttcctgtag attcagatta ccattttgtg tcctgtcagt 12720 

cttacaaact tattttacat ttcttgtaat acaggtt-tac tagtgatgga tttttctcag 12780. 

tctttgcttt tctaaaagta tttgtctcat ctttgttttc aaatggtggt tgatgtgatt 12840 

gtattcttct tgtctaacag ttgccttctt ctacctccag ctctttatag gtttccattt 12900 

ttattggcct ctcttgtaat cattcatttc attgtcctct ctatataatg tgttgatttt 12960 

gtctgaatgc tgtcaggaat tttactcaag attgtggttt ttatcttttg attacagcaa 13020 
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tttgactgca tggtgcctgg gtctagcttt ctttatgttt attctgcttg acgtttgttg 13080 
agctttccaa acctataagc tgatactgtc tgtgaaatgg gaagattgtt atttcccacc 13140 
ctatttttca tcctctcctt ttggtactgt agttacacat gcattgaaat ttgtgctata 13200 
tctcactgat ctctgagatt ctgtttatat ttcttaaatc ttttttcctc tttgttttta 13260 
agattgaata acttgtatta cttagtcttc acgtttacag attgtggtcc ggagaatgta 13320 
tcttttatga tttcaaattg tattaaatta ttttgttttg ttttaatggc ccagcaaaag 13380 
ggtatgtcgt gagagttcca tttgcagttg caaagtatgt gtgttttcca ggtgaatttt 13440 
ttatttcact tattgtggtg ttcaacttca gattttctat tggtattttt tctgtttttt 13500 
aatataaaat cccccatctt ttcagccatc atgcatatat tttccccaaa gtgcttgaac 13560 
atatttatat tagctatttt aaagtccttg tctgctaact ctaaaacgtg agtcatctct 13620 
gggttggttc ctattgacca ttctctgttt ttttattttg ttttttaaat aagtgtcacc 13680 
attttctgtt tctttagtga cttttgattg aataccgggt gttctgaatg atattttgta 13740 
gagattctgt attcttttat gtcccttcaa acatattttc tagcaagtgg atatcatggc 13800 
tggacacaaa ttcccaatcc tgtttctcct gcagtggata tcagctgaaa tttctgctta 13860 
attcttttca gtttctagct tctatgcttt tacaggatcc tctgaggtct cccttatgcc 13920 
acaaatagag gtggtaaagg tttttggtga atttcatatg cagattttgt ggtcactgtc 13980 
ctctgctatt ttccacatac ttattggctg atctgatggt cctagactca gtcccctgtt 14040 
ccctcaagtc attccaccaa ggctgtagcc ttctattact tgagctgcat agactggaga 14100 
atgccttctg gcaaaaagct actaatttgc agatctcctc aggtgaagct ttatctttca 14160 
gggtagactc cagtgtctca gcacttcttc cattttctca aatgttttct ctccattgct 14220 
tttgacatat aatttccttt gcacccataa aatactgcgg agaaagaaaa ttaaagtatt 14280 
tgtacaacaa agttgaactt cctacattgt aatatcatta cctttaggct agatgattct 14340 
atgaagaaat gtttacctta gatagacaaa tataattatt tcatatcaga tagaattttc 14400 
agaattttga ggaaaactca agtgcatgca atctatgtgc ttttcctatc taaaatattt 14460 
ggaagtagcg gcttacttga ttttattaaa tgctttcatt tggataacta gtaatatttg 14520 
cttggaacta aagtatttta cctgtcttct ttatgctttc cttcaaagga taattgtagg 14580 
aagagctatc aaaatcaaat cttggcctta aatatttata agaaatgtga ttattaagta 14640 
ataggagttt tgaaaattgg taaaaaataa atagagaggt ggtggtagtt aaagaacttg 14700 
aataactctt tcagtgaccc cttttaatga ccaagacatc aaggcttgaa agtaaagcat 14760 
gcttacctcc attggcttgt cacactttgc gtttcagcaa eaaatgccta aataatgcag- 14820 
atttcagagt tatgcactat ttcaatttgt agttttaata atgctattgt tcccataaat 14880 
gttaattatt aaacttatgt ggcaaatgta tttttttttg cgaaaacagg attcatgctt 14940 
aacaagtcta gcatcatcat cacttaaaca aattcttgga gattcttttt caccaggatc 15000 
tgagggaaac gcatctggaa aaggtggtta tatctaataa ttatatctta tatgtgaact 15060 
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ctgtactact tagactcctg tttgtaagag aaataatact ttgtatagtt ataagagaaa 15120 
tatatgtttt tatgtgtttg agttttaatc ctgactatgt agttaactaa ctgtgatttt 15180 
ggatgcagaa cttaatctct cagtgcctca atttccctaa gttatattat ttgtctcata 15240 
aggttattgt gaaaattaag tgatatagtg cattttagcc attagcctag ttaatagccc 15300 
aagtggagtg agcacttaag gtaaactact gttatgtatg tgttgctgtg atattctgca 15360 
ggacaacata atagctaggt ggaattttaa agtgagacta agctagattc caatacaggc 15420 
acaattacat aagcaaagta actaaccttt ctgaccctgt atgttgatct ttaaaatggg 15480 
taaaataaga gtaatttgcc ttatagggtg ttgtaagaat taaacatgta aagcatttac 15540 
agcaatacca tagtaagcac ttggtgtgat atgtgaattg ttaacataat ttcttttctt 15600 
agtgatacgt agcttaatga aacctaaaag acatagctat ttctaggtct gagatgtgta 15660 
atgaacattt tagtgcttac tatgtagtat catttttgtc attttacaga tgagaaaagc 15720 
tgaagtgcag tgacttaggg aaacataccc aaggtcagtg atggaaccat agttaaatct 15780 
tgagttccaa agttcttgtt cttttcactg aacagattaa cagctccaaa gaatccaata 15840 
gtgaattgag tgattttaag cccatgttac ctcaaaacaa attccaaaaa aatggtcata 15900 
atgaaaccaa cagaattaag acttttcaca gtaaagattc aggtttagct gcaaggtgga 15960 
cgttggtaga actgaaagtt ggtgatccca ttccaaaatg tggtaaaatc agaatagtag 16020 
aagcaattct ataaatgcaa aactgaatct tcttatgcca gagcttgagc ctgtttcttg 16080 
gagcactgag aggataagca ataggcttgt ctttattgcc ccttatggta tcagaggaag 16140 
tactacatct tggtgagatg aaactcacta gagactgtgt aaaattgcat taattcttgg 16200 
ttctttctgc agctatacaa ttcaacaatt gtactactag taactgtagt agcctagaga 16260 
ggtgtgacac cttcttatgc agcgtgttgt tccagctaag aaactcaggc tttagagtta 16320 
aacaaatatt gtcatctcac ttacttggtt tgtatatcaa caagctcttt tgacatgtcg 16380 
ttgttttagg gtagttattc cattctgttt attaatatgc tatttttcta agtactagat 16440 
ttgttaagtg cttcattagt taagcctaga ctattttttt ttgtaaatca ctttcgaaaa 16500 
gagtttatgc aagtttaata tgataacttt tcttcatatt ttgcaagaaa aaagagttta 16560 
tagatagtcc tcatttaaaa gaaagcaaat gaatcaagta tttaccttat taattcagaa 16620 
gggggtttta atgctattac tctgtctcaa aatagatcca aatgaagaaa tcactgaaaa 16680 
ccataattcc ttgaaatcag atgaaaataa agagaattca ttttcagcag accatgtgac 16740 
tactgcagtt gagaaatcca aggaaagtca agtgactgct gatgaccttg aagaagaaaa 16800 
ggcaaaagcg gaactgatta tggatgatga cagaacagtt gatccactac tatctaaatc 16860 
tcagagtatc ttaatatcta ccagtgcaac agcatcttca aaggtatttg taaaaattca 16920 
tacttttcat actacagctt aaaacttgaa atagaacttt aagaaatttt atcttctgtg 16980 
ttatatactt ctgaattacc agtggaaaat ttatcttttg atagtgatat tgtattgtca 17040 
catggttctt acttaatcca ataaaattta actttaagga aagtttgtag tgaatataat 17100 
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gaaacccagt gtttaaaaat tatcagaggt gtgtgatcat aatatacttt taaatgtctc 17160 

agaaatgcat actcatagtg tatatatttc cataggtctt catattttaa aaatataact 17220 

gtctggaata atttctgaga ttttaaatta gagttatgtt tttggatatt gttttaaaac 17280 

gtgttaacaa ttttaacaaa aatcttaaag aaatgtttat caacagttta tcaacatctg 17340 

tgcttcttta aaatagatgg ttatcatcag gaacattagt attattattc gtatttgatc 17400 

ctttgccttt atttcctaat tttcaaaata atgaactggt gccctggcaa cctccagagg 17460 

tgatgaagtt gctttgtttt ttcttttttc aattcatgta aatttaatgg ttacaagtgc 17520 

ttttttgtta catggatata ttgtgtagtg gtaaagtcag acttttagta taaactaaaa 17580 

tgtacattgt acccattaag taatttctca tcccgcacct ccctctcacc tttcctagtc 17640 

tccattatct antattccat accctatata catgtgtaca cattatttag ctctgacttg 17700 

taagtgagaa catgtaccat ttgactttct gtttctgatt tatttcactt aaggtaatag 17760 

cctccagttc catccatgtt gtaaaagata ttatttcttt tctgtgtggc tgaatagtat 17820 

tcctgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt atacacattt tctttataca 17880 

atcatatgtt gatgtacact taggttgatt ccatatcttt gctattgtga ctagtggtgt 17940 

gataaacatg agtgcaggta tcttttttat ataatgattt attttccttt tggcagatac 18000 

tcacagtggg gttgctggat tgagtggtag ttctatattt agttccttaa gaaatcccca 18060 

aactattttc cataaagatt gtactaattt acattcttac caagagtata caagcattcc 18120 

cttttctctg tgttctcacc aacatctgtt acttttttaa ctttttaata atagctaaat 18180 

attctgacta gtataatata tctcactgtg gttttaattt gtgtttctct gatgattagt 18240 

gatggtgaac attttttttc atgtttcttg gccacttgta tgtcttcttt tcaaaaagtc 18300 

tattcatgtt ttttgccctc tttttagtgg ggttatttgt tttttgttgt tgttgttgag 18360 

gggaacatta ttattataac cttaagaaac agatatgtaa tatgtaggat tacttgtccc 18420 

tacattaaat tgtgcctgag tgctatactt taaaaattta tggtgtagca ttttcagtct 18480 

ttgtttctcc tgaatttgtc attatctctt gtagctgcaa ttagctagca gctctgtgtg 18540 

tttattatca gcggaagaaa acagggctag ctgaaaattt gtgtttgagc aatactttta 18600 

taacataaaa tacaagcutt tcttaaaatt gatgaaggag gttcattaag ccatgttcca 18660 

ggtatatcat ccttagctaa tttctttagg aaaaaaacac tactgctaag ttagggatgt 18720 

gtttattatg tctgtgctct cactttacca ctagcaccca tcagtctgtg taaagtagaa 18780 

aagttgttcc ttaaaagaag aaaggatatt ccggagtrta tagacaggat tgtagaatgt 18840 

ctaatagagg caattctaaa ttagaacagg catttcatat gtaacaagta aggttgtaac 18900 

ttgtttcttt tgactggacc cttggcctca ttcttactct ctactgaatg accttttcta 18960 

aacagaaata taatcattct ccattaaagt ctttttgttg gtttctcatc acaagaattc 19020 

catccagact cctcatcgct gcctagtgat ctcacctggt tcttccctga ccacgtcttc 19080 

ctccgctttc cctgccattc actatgcttc agctccattc acctctttct gtttttcaga 19140 
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gataacaggt tccgtccctt ctcaggcttt tacccacttg ctgtttcttt ctttcataga 19200 
cctttcggtg ggccctttgc actcttagct ctgatgtcag cccctcagga cagccttccc 19260 
tgaccaactt ctttaaagca gctcctcagc cccactctag tcattctctg tcactgcaca 19320 
ctattttatg tccttcatga gccatgtttg cttatatatt tatttttggt catccgtctc 19380 
tagaatttaa tattcttaag ggcattttat tcactgattt gctcccaatt tctactgtgt 19440 
ttgacacata gtagatgctt aaagaatagt gatttactgg cagtttggct tctaagccta 19500 
aaaaggatag ttgtcatgaa taaatcatct ttggcatttt ctgtttaata gaaaacaatt 19560 
gaagatagaa atataaagaa taaaaagtca acaaataata gagcatccag tgcatctgcc 19620 
aggtaataaa gttaccaata tttgtcattt atgggcttgc attctagcaa agctagtttt 19680 
aatttaactt tcataaagta aatttcattt ggtgttactg tattttcttt ttatttccat 19740 
ttcataaaat gaaagtagtt aacttcatga taaaacccct tggttgatga tattatttga 19800 
aataaagtaa tttataaaaa gtaagtctat tactgattgt tttagtgcct ggaatgttta 19860 
tgcaatacct ttgctctcca ggatcgtcct aggaatattt ttcttctttc ttaatgtcag 19920 
tgattaggga rtctttgtgc tccagactgc ttctggaata gagcttcttt ctcctacttt 19980 
tcctgagaca agcaatataa aatggtaata aagctgaagt ctagcaatga tacttattca 20040 
ttatcaagta tcattgtcta acatgagaaa ttgtactgaa agccttcaga atctatgaac 20100 
taagtaggtt tattaaaatg attatctgta tagcttcatt cacaccaatg ataatgaatg 20160 
cctaactcat aagtgctaat caaaaacctt ctgaatcttt aaaattatcg ttagtcaaat 20220 
tatcattaat caaataaaac agagctagca agctttttct gtaaatggcc agttagtgca 20280 
tattttaggc tttgtaggcg atacagtctg tattggaact actcatttct gctattttaa 20340 
caggaaagca gccacaggca aaacttaaca tgaatgatta cagctatggt gcaataaact 20400 
ttgtatatca aaaccaatgg ctggccaaat tttcccacca atccctgata tagatagtac 20460 
tattctttct aattttatat ttggaatgct tcatgtaaca aaatgatgaa agaaaatatt 20520 
aaaagagtga ttataaccta ctgtattgtt ttttccatgt aacttgagaa gtggtccata 20580 
tttcttaagt ttctaattac aaatatttaa aaagagcaat cattttaaag ctatataact 20640 
taaagttata aaatttaaat tatgttgaag gggacatatt taagttatgt ccccttctac 20700 
ataatttaat attctttgta tactaagact gtacatttta cctacatcat tttcaaagta 20760 
attataattt gttaaattat aatgtagttt ccaatttttt ttttgagatg gagtctcact 20820 
ctgttgctca ggctggagtt cagtggcatg atctctgctc actgcaacct ctgcctcctg 20880 
ggctcaagct atcctcccac ctcagcctcc agggtagcta tgactacagg catgtgccac 20940 
cacgccagct aattttttgt atttttggta gagacagggt ttcaccatgt tgcccaggct 21000 
ggtcaacagc ccaacaggat gagctcaagt catccaccca ctttggcctt ccaaagtgct 21060 
gggattacag gtgtgagcca tcatgcctgg ccagttttca aatattatac gtgcatattc 21120 
taacagatct ctcttctacc aaatgcaatt gtaatatttt gtcttgattc atttggatct 21180 
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tttcagatta atgacctctg agtttttgaa gaaatctagt tctaaaagga gaactccatc 21240 

gacaactacc tcttctcact atttagggac tttaaaagtc ttggaccaaa aaccttcaca 21300 

gaaacagagc atagaacctg atagagcaga taacataagg gcagctgttt atcaggtaaa 21360 

aaaggaaaat atttttaaga gaagaagaat gatcactttc ataagcctac actgtttata 21420 

aagaataaag taatcctgat agaaaatgat ggtttaatac ttaaatttat tgagaaagag 21480 

tttcctttta atacatgagt aatcatattt tactaaatta tttgcttcca cactttgcat 21540 

aactgaccat agttgttttt aaagaaagaa tatgccattg caatttatag aaatacagca 21600 

caagccaaaa cattgtaaag tctatatatg ttttcatttt tttcttcttg aagtttatat 21660 

gaacaaaagg agttattatg aacaaaaagt tattaaattt tttctttcct gagatgttgt 21720 

taggcgtaca taggaaaaag attgtattaa tttattcaca attctaaaag tctttttttg 21780 

tcttttttag agtagaatag tatactttag aaaattgtac atgtgaattt cagagaaaat 21840 

gttaatataa agaattctaa ttcacttaag aaattttaaa tattatatga cctttttctt 21900 

gttcttatag gagtggttag aaaagaaaaa tgtgtattta catgaaatgc acagaataaa 21960 

aagaattgaa agtgaaaact taaggatcca aaatgaacag gtattctgac atatagaagt 22020 

aaaaatgttt tggattttta tttcagtaaa atatccctga atatataact tttctaaanc 22080 

agctttttaa atggcaaaat aacttgtata ttaaagaaat gatttccggt tttacttctg 22140 

ttttacttta tacattttag tttgatataa ctgttttaca tgaaaacaga ttttaatttt 22200 

gtatatgtat aggatagctt tgttcctgct gattatgaag ttattattgt ttatgagcac 22260 

ctaattcact tttaaaagtt gatttcattt agaacttaac caagaaggcc aggtactgtg 22320 

gctcatgcct gtaatcccag cactttggga ggccaaggca gatgggattc cttgaggtct 22380 

ggagttcgac accagcctgg gcaatgtggt gaaaccccat ctctactaaa aatacaaaaa 22440 

ttagccaggg atggtggtgg gcacctgtaa tcccagctac tcaggaggct gaggtggcag 22500 

gatcacttga acccgggagg cggaggttgc agttagctga gatcgtgcca ctgtactcca 22560 

gcctaggtga cagagactct gtctcaaaaa aaaaaaaaaa ggcacgacaa gataaaggat 22620 

cattagacac tagttagcct tcaattttcc tcttttctct cttgaatttt ataagtatct 22680 

tcaagtccaa cccctacctg aactcttgat ctgtatcctt tcccattgaa tggaggtgaa 22740 

cttttgttcc tgtctcttct gtactgagtc tcttcctcta actcctgctt gtaatacgct 22800 

cagttatttc ttatcttcta aagtcaaact tctggacaaa aactccagtg tgctgttcaa 22860 

tactaaaaat agatttagaa gaaaaatatt ttccaaggtg aactgcacga taatgcgtca 22920 

gtagtgaagg gagcagccct ccagggggcg -tgcctgtcta- tctgttaacc acgttcatag .22980 

cagtatgctg ctgtggtcag tgccataccc cttctcattt gattttcgta gctctgtgag 23040 

gtagatagta ctttgacctc taaattatgt taccccaata ttaaggtttt atgtcattta 23100 

atattgaaca ataaagcaaa catagaatat tatgggatta gattgaagga agtaaaataa 23160 

taacataact tgctatacag tctccaacct atttttcagt cgagcacata ctttcaacat 23220 
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ttggaataca tttgtgcagt aagaacttta tgttttgata ctattcaaaa ttaagattta 23280 
aaccaaaaat ctgcatctta ctgcatggct tggccaattt gccttactct aacttacttt 23340 
ataagcccat aactttactg attttttttt caaatatttt attatgaaaa ttttactata 23400 
ccacttagcc tattacagtt tattttgata taatttgttt agtacacttt caaaaataat 23460 
agttgacatc tttctcatta ataggtcaat atgtgataaa tgtttttaga aaaggacgtt 23520 
ttaaaaccaa tgaataattc agataacatt ctttgtaaat tatctaagcc attctaaata 23580 
aattacctac tttgaaagtt aatttctaag tataatgaat atcagaggac taaagataaa 23640 
tgtatatgtg tatatttata tctagccata tttgtgtcta tgtatatata catatatatg 23700 
tatatcactc tattattttt tccactgtag aaaaaagctg ctaaaagaga agaagcatta 23760 
gcatcatttg aggcctggaa ggctatgaaa gaaaaggaag caaagaaaat agctgccaaa 23820 
aagaggcttg aagaaaaaaa caagaagaaa actgaagaag aaaatgctgc aagaaaagga 23880 
gaagcactac aagtattcag aactttgcac atcttaatta ttttaaaaca tttgaaatcc 23940 
aaattaatga ttaaccatat ttttatttat tttcaaatat tcacagtaag aaaattattc 24000 
tgaacttttt caggcttttg aaaaatggaa agagaaaaag atggaatatc ttaaagagaa 24060 
aaatagaaag gagagagaat atgaaagagc aaagaaacag aaagaggagg aaactgttgc 24120 
cgagaaaaag aaagataatt taactgctgt tgagaaatgg taatccaaaa tcataaatat 24180 
tttgatatat tttaaattat agtaacactt caggatttta taaaatttat ttacttgaaa 24240 
tttagtaatg catttcaatt tcattactgt caaagatgta ctagggaatc tttattatgt 24300 
attttccttt aactctccag tgttttatac tatgctctat aggaatgaaa aaaaggaagc 24360 
ttttttcaag caaaaggaaa aagaaaaaat aaatgagaaa agaaaggaag aactgaaaag 24420 
agctgagaaa aaagataaag ataaacaagc tattaatgaa tatgaaaaat ggctggtagg 24480 
tattatttgt caatgcactt tcgtcttttt catgtacctt ttgtgtcttt tctgtcccta 24540 
attctaattc tatttgctcc agacctactg atcatttcta cctggaatct gctttgttga 24600 
attcaagctc tcctcctgca tatagcatat tttctttgac ttagtcattt ctattaatgt 24660 
ttctactatt ccctcaaaca cccaggctga aaacttgtta taatcttctt ccttacctgc 24720 
atccccacat ttaccattta ctattcatgc ccattcttcc tttgctgtga ttctcacatc 24780 
taacatagaa agaagacaag tttactattg agggtactac gtggtggaac ttggtcatga 24840 
caaaaagtaa cactgaactt aatagtgaga aaattattcc atcttttatt ctcttttgat 24900 
gtttctgatg acctcaagga gaatctctta tttaggaatt tttaatgaaa gagagcaggt 24960 
ttgaggttta ggaggagcaa tagctagctg aaccagatat gtgtatatat ttgatttcac - 25020 
tttacttatc tttataaaag ttactttttg ttgatgtcaa gcaaaatatt attttccatt 25080 
ttagaatatc aatataaata tgcattttgt ccatgtttat ataagtaata cattactatg 25140 
aataaatact ttacataagt aggtaacaca ttcatatgaa tagttaaeat attcatatga 25200 
ttcagcaacc aaaattatag tatttttgca ctagaagtct atccagtcag gtttcctatc 25260 
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aaactttaaa acaactcata ccaatcaact aaatcatcca ggttgttttt gatttgcatt 25320 

tctctggtta gaattgagct tgaatatctt ttcatttgta tacaggccat ttatctatta 25380 

ttttctctgt aaattgtcat ttcatagact ttgcacactt ttctattaga ttgttggttt 25440 

tttttcctta ctggtttcta gaatcttttg ttttgtactg gggaaattag cctatcattt 25500 

tttatatggg ttgcaaatat ttacccccac tatattgttg gtttcccggc tttccttata 25560 

gtatctcatg ccatgaagaa tttaaatttt aggtgtcaga tttctgtttt ttttttttgg 25620 

cttttgattt tcaagcatag ttgaaaagac ctacacaatt tgagattaaa cagaattatc 25680 

ttatttttct tctaacaact ttgtgacttt aatatcttaa tgttttaaca tttgttctgc 25740 

ttggaatttg ccctgataca tggtgggaaa tatgatttca actttagttt ttccaaatgt 25800 

atcctttata aagtagccca tttttaccca ttgatttgag gtgctacttc tgttatatga 25860 

taccttctca tgttttcggg tctgtttctt aactttctgt tccattggtc agtctcgtga 25920 

ttccagtgcc acacttccat tattaggctt gatatgtcta aatatctgct tggattcatc 25980 

tccctttata gttcttcttt cacagtcttt ctgaccagtc ttgtttattt attttttcca 26040 

taaacttaag aatcagcagt agttagaaag gtacatggga ccaaaatgag cgatttaaag 26100 

ataggataaa aagataaaac aataataaac ttaagaaaca tgccagacca acataaagaa 26160 

aattgtagaa ctctcctgaa caacacaaat gaagacttga gaaaatggat cagaattgcc 26220 

catgcacaga aacacactta accttataat gatgttataa ggatgtcagc tctccctgaa 26280 

gtcatttaat gcaatcttaa caaaagccaa caggatttac tctgtgtgtt gagtttagta 26340 

ctgctatatg ctaattcgat gcagagaaat agtaataaaa taaggtaatc aaaattggtt 26400 

caattttgaa tgaaaaaggt agtgtttcat gatgatttcc ttaagttaat ctgttaaata 26460 

atgctatgtt ctaaaaaaaa atttaaagtc cacttatatt aagaagatgt acactgactg 26520 

ctagtatcaa ttagggaaat taaatgtaaa catttgagtt ttccatttta attccatatc 26580 

ttcatgaaaa tggaatagaa tttctttaat aagtcacatt taggtatact gtttttaatt 26640 

atagcactta attacattgt cattcttatc agtcctctga agaacaagaa ttcctcaaag 26700 

accaaagaca aaataacatg tttgatatct agtaaaatgt ctgcaaatat agtacaccta 26760 

taaacacata aacatacatg ttacagatcg gttctccttc ttaccaaatt cttattgaaa 26820 

tttgtttgca gatagaatag aaaaattgcc cctgtatagg agtctaatga cttcagtttt 26880 

catggaaaac aacatctcaa gctttttata tacaaactag tttgaacagt aagcatttgg 26940 

tgggtaattg ctttagggga aagttaatag ccaaagatca ggtaagacta aaatattttt 27000 

cttgccaatt accagattaa ttcatcatta cctttagtaa gaaaataagc aaaaagctca 27060 

gttttccaca aataaatgtc tgaaggactt tttaacaagg ttcttttaat tactatcaag 27120 

gtgactattg attcttttga actgatatta cagttaatat aattgtctat ttgctaccct 27180 

ggctttacag ctccctgcta gtaagatgaa gcatatttca agttactgcc ccctcatgtt 27240 

aagtgaaatt acaaaaagag atttattcag tcaatttctg tggacacagt ctggtcactg 27300 
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cttttcttcc gcctagctag atggtctgtc tctaaaatat taaaatgatt gaagatgatc 27360 

taattacagc tttgcttttc tcaattaaaa ttctgaaagg aagtttcctc tttgccttat 27420 

tagaaatagc aagcaaacaa acatgcaagc attcttatga catggaatga ggatatgggt 27480 

gttaacattg acaaaaaaca aacaaacctc ccacttcact ttgtttgtta catgtgaatg 27540 

gaaagcttgt cctgtattgc catattattc ttgtggcatt tatatatata ctgatgaaaa 27600 

gatgcataca tacctaatca ttttccataa tgcctttcct cccaagccat caacctgcag 27660 

aggcaggttt cactaagggt tttcctgctc cttgaggaat atgagaaaaa taccaagatg 27720 

aagaaaccac caaaccttat agtgttagca gagacataaa gggacacctg gtgcccctct 27780 

tccatttctt gtctcctgcc ttctgccaag ccttagtcac aatggatatt tttgtttcct 27840 

cccacagcac acattttttt tcccactctc agagccctca ccactactgt ttgcaagcaa 27900 

agctcttccc cgatatttat cacgagtggc ttctcttatc catcatgtca cacttcaaag 27960 

ggactttccc tgagtccatt ttttgttgaa agtaaatact cttttttatt ccttctcata 28020 

gttttaaaac atgtttcaga gaaattcaca caatttggaa ttatctgttg tttattttct 28080 

ttgtttctgt ccattttgaa agttccctgg gggacaggga ccatatctgt gtgttgggat 28140 

tttaaaaaat tatttttatt tgcaaatgac acataaaaag tgcacatatt tatggaatac 28200 

agtgtgatgt ttccatctac attgtataca ttgtgtaaca atcagaaatg actcacaaag 28260 

gtaggcaaaa tgtttgatgc aaagatatca ttaatattta ttataggaaa gtacacaaat 28320 

tactaaaaat taaaggcaaa taccatacat ttaaatgggc caaataattg agcagaaaat 28380 

ttacaaaagg ctaaagaaat gtttgaaaat gtgctcaagt tcaataataa agaaacatga 28440 

ggcagaattt ttaactattt gtaaaaaatt tgaagtatct catactgtca tgacatattg 28500 

aaactttgca cccagtaaac ttacttctga gaatttgttc tcacgaagtc accaccaact 28560 

tataacagtt actatatttg agttataatt ataggtcttt ttttctattt tatacaattc 28620 

ttttttaatg ttttcacttt taaagtttaa aaaattaagt gatattagta cttgcaaatt 28680 

gacaatgttt actaattttt ttcttgtttc cattttttgt ttgtttgttt ttttgagaca 28740 

gggtctcact ctgttgccca ggctggagtg cagtggtgca atctcggctc actgcaacct 28800 

ccacctccca ggctcaagca atcctcccat ctcagcctcc taagtaggtg ggactatagg 28860 

catgcaccgc cacacctggc taatttttgt gttgttttgt agagatgatg tttcaccatg 28920 

tttcccaggc tggtctcgaa ctcccaggct caaacaatcc acccacctta gtctcctaaa 28980 

gttctgggat tactggcatg agccaccatg cctggcccta cctgttattt ctttatgatc 29040 

tgttaaacta ggaagtgata tataaatate etataatgga ttattttgtt cttcagcaag 29100 

caacctgatt tgaaaataat aatcatatat gtacataaat ttatagtgtt ctattttctc 29160 

tttaggaaaa taaggaaaaa caagaaagaa ttgaacgaaa acagaagaaa cgtcattcct 29220 

ttcttgaaag tgaggcactt cctccgtgga gccctccaag cagaactgtg ttcgcaaaag 29280 

ngttttgata attctagttc ttacattatt tggttattta tcggtttgcc aatattagcc 29340 
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atagatttaa aaccattcaa ttatttatag ttagaggaat atattttaat taaatgccag 29400 

acactcctgc tgacaatgaa agaaatactt tggaatgtaa tcagtgaaag catttttttg 29460 

aactgtagat aaactgcctc aaacaaagac ctaataatca gattgttttt accattaaga 29520 

tacataagat tttatcatgt cctgataatt cttatggtgg agtgattcat gatctttttc 29580 

attaagctct gtatgttatt taagtatatt taattccagt aataaaaagg aaatcatcta 29640 

ggtaccataa tgatagaaat tattcctttt gtggatgatt gtgaatctag attcaggttt 29700 

ttaaatgaag ggtcgctggg aagtgcgcat atattattcc ttctgaaact 29750 

<210> 17 

<211> 200 

<212> DNA 

<213> Homo sapiens 



acttccttcg tctgggtggt tgccccagcg acacgttggg ccgaagagcg gtgttgggta 60 

cccgagagac ccggcggtgg ggaagtcact tcctcccgaa gacgctgttt cctagcaacc 120 

gccctccgcc tctgttatta gcccctcctc ctcgctcggt ccaggaccgg ctctgcgggc 180 

gccgccaggc ccagaccaag 200 

<210> 18 

<211> 139 

<212> DNA 

<213> Homo sapiens 



ctactatcag aagttgaatt ctaataatta gctattttat aaaggtaacg agaaaaaata 60 
cactatgtct gatgaagttt ttagcaccac tttggcatat acaaagagtc caaaagttac 120 
caaaagaact actttccag 139 

<210> 19 

<211> 85 

<212> DNA 

<213> Homo sapiens 



gatgagctaa taagagcaat tacagctcgc tcagccagac aaaggagttc tgaatactca 60 
gatgactttg acagtgatga gattg ^ 85 
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<210> 20 

<211> 321 

<212> DNA 

<213> Homo sapiens 



<400> 20 
tttctttagg 


tgatttttct 


gacacttcag 


cagatgaaaa 


ttcagttaat 


aaaaaaatga 


60 


atgactttca 


tatatcagat 


gatgaagaaa 


agaatccttc 


aaaactattg 


tttttgaaaa 


120 


ccaataaatc 


aaacggtaac 


ataaccaaag 


atgagccagt 


gtgtgccatc 


aaaaatgaag 


180 


aggaaatggc 


acctgatggg 


tgtgaagaca 


ttgttgtaaa 


atctttctct 


gaatctcaaa 


240 


ataaggatga 


ggaatttgaa 


aaagacaaaa 


taaaaatgaa 


acctaaaccc 


agaattcttt 


300 


caattaaaag 


cacatcttca 


g 








321 



<210> 21 

<211> 227 

<212> DNA 

<213> Homo sapiens 



<400> 21 

cagaaaacaa cagccttgac acagatgatc actttaaacc. atcacctcgg ccaaggagta 60 

tgttgaaaaa gaaaagtcac atggaggaga aggatggact agaagataaa gaaactgccc 120 

tcagtgaaga attggagtta cattctgcac cttcttccct tccaacgccg aatggcatac 180 

aattagaagc tgagaaaaaa gcattctctg aaaaccttga tcctgag 227 

<210> 22 

<211> 94 

<212> DNA 

<213> Homo sapiens 



<400> 22 

gattcatgct taacaagtct agcatcatca tcacttaaac aaattcttgg agattctttt 60 
tcaccaggat ctgagggaaa cgeatctgga aaag - 94 

<210> 23 
<211> 248 
<212> DNA 
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atccaaatga agaaatcact gaaaaccata attccttgaa atcagatgaa aataaagaga 60 

attcattttc agcagaccat gtgactactg cagttgagaa atccaaggaa agtcaagtga 120 

ctgctgatga ccttgaagaa gaaaaggcaa aagcggaact gattatggat gatgacagaa 180 

cagttgatcc actactatct aaatctcaga gtatcttaat atctaccagt gcaacagcat 240 
cttcaaag 

<210> 24 

<211> 71 

<212> DNA 

<213> Homo sapiens 



gagtggttag aaaagaaaaa tgtgtattta catgaaatgc acagaataaa aagaattgaa 
agtgaaaact taaggatcca aaatgaacag 

<210> 27 

27 



248 



60 
71 



aaaacaattg aagatagaaa tataaagaat aaaaagtcaa caaataatag agcatccagt 
gcatctgcca g 

<210> 25 

<211> 169 

<212> DNA 

<213> Homo sapiens 



attaatgacc tctgagtttt tgaagaaatc tagttctaaa aggagaactc catcgacaac 60 
tacctcttct cactatttag ggactttaaa agtcttggac caaaaacctt cacagaaaca 120 
gagcatagaa cctgatagag cagataacat aagggcagct gtttatcag 169 

<210> '26 

<211> 90 

<212> DNA 

<213> Homo sapiens 



60 
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<211> 160 
<212> DNA 
<213> Homo sapiens 

<400> 27 , A 
aaaaaagctg ctaaaagaga agaagcatta gcatcatttg aggcctggaa ggctatgaaa 60 

gaaaaggaag caaagaaaat agctgccaaa aagaggcttg aagaaaaaaa caagaagaaa 120 

actgaagaag aaaatgctgc aagaaaagga gaagcactac 160 

<210> 28 

<211> 146 

<212> DNA 

<213> Homo sapiens 

<400> 28 cn 
gcttttgaaa aatggaaaga gaaaaagatg gaatatctta aagagaaaaa tagaaaggag bu 

agagaatatg aaagagcaaa gaaacagaaa gaggaggaaa ctgttgccga gaaaaagaaa 120 

gataatttaa ctgctgttga gaaatg 146 

<210> 29 

<211> 133 

<212> DNA 

<213> Homo sapiens 



<400> 29 

gaatgaaaaa aaggaagctt ttttcaagca aaaggaaaaa gaaaaaataa atgagaaaag 



133 



60 

aaaggaagaa ctgaaaagag ctgagaaaaa agataaagat aaacaagcta ttaatgaata 120 
tgaaaaatgg ctg 

<210> 30 

<211> 485 

<212> DNA 

<213> Homo sapiens 



<400> 30 crk 

gaaaataagg aaaaacaaga aagaattgaa cgaaaacaga agaaacgtca ttcctttctt 60 

gaaagtgagg cacttcctcc gtggagccct ccaagcagaa ctgtgttcgc aaaagtgttt 120 

tgataattct agttcttaca ttatttggtt atttatcggt ttgccaatat tagccataga 180 

28 
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tttaaaacca ttcaattatt tatagttaga ggaatatatt ttaattaaat gccagacact 240 

cctgctgaca atgaaagaaa tactttggaa tgtaatcagt gaaagcattt ttttgaactg 300 

tagataaact gcctcaaaca aagacctaat aatc^gattg tttttaccat taagatacat 360 

aagattttat catgtcctga taattcttat ggtggagtga ttcatgatct ttttcattaa 420 

gctctgtatg ttatttaagt atatttaatt ccagtaataa aaaggaaatc atctaggtac 480 

<210> 31 

<211> 24 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 31 9 . 
atgtctgatg aagtttttag cacc ^ 

<210> 32 

<211> 22 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 32 yy 
aggcctcaaa tgatgctaat gc " 

<210> 33 

<211> 21 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 33 91 
atcatttgag gcctggaagg c " 
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<210> 34 
<211> 23 
<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 34 „ 
aaacactttt gcgaacacag ttc " 

<210> 35 

<211> 21 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 35 71 
acaacgaata acagagtgtc c 

<210> 36 

<211> 20 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Amorce 

<400> 36 7n 
actcctgata aacagctgcc cyj 

<210> 37 

<211> 29 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 
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<400> 37 -> Q 
gccaccatgt ctgatgaagt ttttagcac ^ 

<210> 38 

<211> 24 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 38 7 . 
gaaacacttt tgcgaacaca gttc ^ 

<210> 39 

<211> 26 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 39 

taatgtctga tgaagttttt agcacc 

<210> 40 

<211> 26 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 40 

tcaaaacact tttgcgaaca cagttc 

<210> 41 

<211> 25 

<212> DNA 

<213> Artificial sequence 
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<220> 

<223> Amorce 

<400> 41 9t - 
aatgtctgat gaagttttta gcacc ^ 

<210> 42 

<211> 19 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 42 1Q 
tcagcttgcc gtaggtggc A * 

<210> 43 

<211> 19 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Amorce 

<400> 43 

atggtcctgc tggagttcg 

<210> 44 

<211> 391 

<212> DNA 

<213> Murinae gen. sp. 



<400> 44 cn 

aaagaagtga agacagaaac acgaagaata aaaagacaac gaataacaga gtgtccagtg bu 

cctctggcag gctgatgacc tctgagtttt taaagagatc cggtcccaca aaaagaagtc 120 

catctgcagc tacctcctca cactatttag ggagtttgaa agtcttggac cagaagcaac .180 

cacggaagca gagcctagag ccagacaagg ctgatcacat aagggcagct gtttatcagg 240 

agtggttaga aaagaaaaat gtgtatttac atgaaatgca cagaataaaa agaattgaaa 300 

gcgaaaactt gaggatccaa aatgaacaga aaaaagctgc taagagagag gaagccctgg 360 

catcatttga ggcctggaag gcaatgaaag a 391 
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<210> 45 

<211> 2767 

<212> DNA 

<213> Mus musculus 

<220> 

<221> CDS 

<222> (204).. (2147) 
<223> 



<400> 45 

gttgggtacc caagagacca ggcggttgga agtcacttcc tcccggggac gctgttgcct 

agcaaccgcc ttctgcctcc atcttttgcc ccgcctccag gttattccaa tacctggttt 

cccagaccgc gaggcccggg ccgggggcga cacctgtgct agagcatagc cgctgggttc 

tcagcagaga aaaaggacac acc atg tec gat gaa ate ttc age aca act ttg 

Met Ser Asp Glu He Phe ser Thr Thr Leu 
15 10 

gcg tac acc aag agt cca aag get acc aag aga act tec ttt cag gat 
Ala Tyr Thr Lys ser Pro Lys Ala Thr Lys Arg Thr Ser Phe Gin Asp 
15 20 25 

gag ctg ate aga gee att aca gee egg tea gec agg cag aga agt tec 
Glu Leu lie Arg Ala lie Thr Ala Arg Ser Ala Arg Gin Arg Ser Ser 
30 35 40 

gaa tac tec gat gac ttt gac agt gac gag att gtt tct tta ggt gaa 
Glu Tyr Ser Asp Asp Phe Asp Ser Asp Glu lie val ser Leu Gly Glu 
45 50 55 

ttt tea gat acc teg aca gat gaa agt eta gtt aga aaa aag atg aat 
Phe ser Asp Thr ser Thr Asp Glu Ser Leu val Arg Lys Lys Met Asn 
60 65 70 

gat ttt cat ata tec gac gat gag gaa aaa aat tct cca aga ctg tct 
Asp Phe His lie Ser Asp Asp Glu Glu Lys Asn Ser Pro Arg Leu Ser 
75 80 85 90 

ttt ttg aaa acc aag aaa gta aac agg gca ata tec aac gat get ctg 
Phe Leu Lys Thr Lys Lys val Asn Arg Ala lie Ser Asn Asp Ala Leu 
95 100 105 

gac tec age act ccg ggc age gaa ggc teg tea ccg gat get caa gaa 
Asp Ser Ser Thr Pro Gly ser Glu Gly ser Ser Pro Asp Ala Gin Glu 



110 



115 



120 



gat gtg act gga gat tec etc ccc aaa tct caa aat gat gat cga gaa 
Asp val Thr Gly Asp Ser Leu Pro Lys ser Gin Asn Asp Asp Arg Glu 



125 



130 



135 



gtc ggc aga gag ate ate aca gtg aag cct aca ccc agg atg cac ccc 
Val Gly Arg Glu lie lie Thr val Lys Pro Thr Pro Arg Met His Pro 



140 



145 



150 



60 
120 
180 
233 

281 

329 

377 

425 

473 

521 

569 

617 

665 
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713 



gtc aaa aga age acg tec teg ggg gaa acc age age ggt ctt gat gca 
val Lys Arg ser Thr Ser Ser Gly Glu Thr Ser Ser Gly Leu Asp Ala 
155 160 165 170 

gat ggc cac ttt aag cct tea ccc cag cca agg age atg tta aaa aag 
Asp Gly His Phe Lys Pro Ser Pro Gin Pro Arg ser Met Leu Lys Lys 
v 175 180 185 

age age cac act gag gag gga gtc aga cca gga gtt gat aaa gaa cat 
Ser Ser His Thr Glu Glu Gly val Arg Pro Gly val Asp Lys Glu His 
190 195 200 

tec ata age gaa gec tct get ccc aca cct tec ctt cca agg cag aat 
Ser lie Ser Glu Ala ser Ala Pro Thr Pro Ser Leu Pro Arg Gin Asn 
205 210 215 

qqc aca gag ttg caa act gag gaa aaa ata tac teg gaa aac etc gat 
Gly Thr Glu Leu Gin Thr Glu Glu Lys lie Tyr Ser Glu Asn Leu Asp 
220 225 230 

ctt gag gac tea etc tta caa agt ctg acc tea tct tec ttc aaa gaa 
Leu Glu Asp Ser Leu Leu Gin Ser Leu Thr Ser Ser Ser Phe Lys Glu 
235 240 245 250 

age ccc gga ggt tgc aca tea cca gga tct cag gaa aag gtg ccc ata 
Ser Pro Gly Gly Cys Thr Ser Pro Gly ser Gin Glu Lys val Pro lie 
255 260 265 

aaa gat cat gat gga gaa cct act gaa ate tgg gat tec ttg eta tea 
Lys Asp His Asp Gly Glu Pro Thr Glu lie Trp Asp Ser Leu Leu ser 
y 270 275 280 

aat gaa aat gaa gga agt tct gtt ttg gtg aac tgt gtt act cct gaa 
Asn Glu Asn Glu Gly ser Ser Val Leu val Asn cys val Thr Pro Glu 
285 290 295 

etc gag cag ccc aag gac ggt cag gtg gca get gac gac ctt gag gaa 
Leu Glu Gin Pro Lys Asp Gly Gin val Ala Ala Asp Asp Leu Glu Glu 
300 305 310 

qaa aqa gag aag ggt gga ttt aca gaa gat gac etc acc act gac ccg 
Glu Arg Glu Lys Gly Gly Phe Thr Glu Asp Asp Leu Thr Thr Asp Pro 
315 320 325 330 

ctg etc tec acg tec ccg agt gtc ata aca ccc act gag cca gca gag 1241 
Leu Leu Ser Thr ser Pro ser val lie Thr Pro Thr Glu Pro Ala Glu 
335 340 345 

ccg gee aag aaa gca aat gaa gac aga aac acg aag aat aaa aag aca 1289 
pro Ala Lys Lys Ala Asn Glu Asp Arg Asn Thr Lys Asn Lys Lys Thr 
350 355 360 

acg aat aac aga gtg tec agt gee tct ggc age agg ctg atg acc tct 1337 
Thr Asn Asn Arg val ser ser Ala Ser Gly Ser Arg Leu Met Thr Ser 
365 370 375 

gag ttt tta aag aga tec ggt ccc aca aaa aga agt cca tct gca get 
Glu Phe Leu Lys Arg ser Gly pro Thr Lys Arg Ser Pro Ser Ala Ala 
380 • - 385 390 

acc tec tea cac tat tta ggg agt ttg aaa gtc ttg gac cag aag caa 
Thr ser Ser His Tyr Leu Gly ser Leu Lys val Leu Asp Gin Lys Gin 
395 400 405 410 

cca egg aag cag age eta gag cca gac aag get gat cac ata agg gca 1481 

Pro Ara Lys Gin ser Leu Glu Pro Asp Lys Ala Asp Hts lie Arg Ala 
415 420 425 
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1001 
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get qtt tat cag gag tgg tta gaa aag aaa aat gtg tat tta cat gaa 
Ala Val Tyr Gin Glu Trp Leu Glu Lys Lys Asn val Tyr Leu His Glu 

435 



430 



440 



atg cac aga ata aaa aga att gaa age gaa aac ttg agg ate caa aat 
Met His Arg lie Lys Arg lie Glu Ser Glu Asn Leu Arg lie Gin Asn 
445 450 455 

gaa cag aaa aaa get get aag aga gag gaa gee ctg gca tea ttt gag 
Glu Gin Lys Lys Ala Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu 
460 465 ~ 470 

gee tgg aag gca atg aaa gag aag gaa gca aag aga ata get gca aaa 
Ala Trp Lys Ala Met Lys Glu Lys Glu Ala Lys Arg lie Ala Ala Lys 
475 480 485 . 490 

aag agg ctg gag gaa aag aac aag aag aaa aca gaa gaa gaa aat gee 
Lys Arg Leu Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala 
495 500 505 

atg agg aaa ggc gag gee ctg caa gca ttt gaa aaa tgg aaa gag aaa 
Met Arg Lys Gly Glu Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys 



510 



515 



520 



aag eta gaa tac etc aaa gag aag ace agg agg gag aaa gaa tat gaa 
Lys Leu Glu Tyr Leu Lys Glu Lys Thr Arg Arg Glu Lys Glu Tyr Glu 
525 530 535 

aga gca aag aaa cag aaa gaa gag gaa gcg gtt get gag aaa aag aaa 
Arq Ala Lys Lys Gin Lys Glu Glu Glu Ala Val Ala Glu Lys Lys Lys 
540 545 550 

gac agt tta act get ttt gaa aaa tgg agt gag aga aag gaa get etc 
Asp Ser Leu Thr Ala Phe Glu Lys Trp Ser Glu Arg Lys Glu Ala Leu 
555 560 565 570 

etc aag caa aag gag aag gag aaa ata aat gag aga aga aag gaa gag 
Leu Lys Gin Lys Glu Lys Glu Lys lie Asn Glu Arg Arg Lys Glu Glu 
575 580 585 

ctg aag aga gec gag aag aaa gac aaa gac aag caa gee ate agt gaa 
Leu Lys Arg Ala Glu Lys Lys Asp Lys Asp Lys Gin Ala lie ser Glu 
590 595 600 

tac gaa aag tgg ctg gaa aag aaa gaa agg caa gaa aga att gaa egg 
Tyr Glu Lys Trp Leu Glu Lys Lys Glu Arg Gin Glu Arg lie Glu Arg 
605 610 ~ 615 

aaa cag aag aag cgc cac tec ttc ctt gag age gag aca cac cca cca 
Lys Gin Lys Lys Arg His ser Phe Leu Glu ser Glu Thr His Pro Pro 
620 625 630 

tgg agt cct ccg age aga act gcg ccc tea aaa gta ttt tga 
Trp Ser Pro Pro Ser Arg Thr Ala Pro ser Lys val Phe 
635 640 645 

tgtttctggt tcttgatttt tttttcagtt caccaactgt actcatggat ttaaaacgag 

tcatctcatt atttgtggtt agaagactct atgtcacttc ectgeaggag cttctgtgga 

gcatgaaaga gatactttgc agtttaatca gtggaaacat tttctgaagt gtcctcatca 

gtttgctggg acaatccaga egcatgaage tttattatga cctgaacagt ctggtgtggg 

gtgattcgtg gtcactgtcg ctgagttcgg agtcttttta aagaatgttt gatcccacta 

atgaaagaat gecagctaga taccacaatc gtagagatga cteggtctgt ggaagtctgt 

35 
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gcttctagag tgtagtttgg gcattgaagg tccctggaga ccatgggcat gttatctctt 2567 

ctaactccag ttcttcaggt cacagaagta tctttgctgt gcaagttatc gactcagtca 2627 

gttgaggcca cagaactcta gtcagtcact ttagtaaaga actttgccat agggtttaat 2687 

ctcggtgtgg tttgccttct tgaggcttac ctgacaatcg tagccacctc tataatgggc 2747 

tcacttctgg aatgttcttt 2767 

<210> 46 

<211> 647 

<212> PRT 

<213> Mus musculus 

<400> 46 

Met Ser Asp Glu He Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
1 5 10 15 

Lys Ala Thr Lys Arg Thr ser Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg Ser ser Glu Tyr Ser Asp Asp Phe 
35 ~ 40 45 

Asp Ser Asp Glu lie Val Ser Leu Gly Glu Phe Ser Asp Thr Ser Thr 
50 55 60 

Asp Glu ser Leu val Arg Lys Lys Met Asn Asp Phe His lie ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn ser Pro Arg Leu Ser Phe Leu Lys Thr Lys Lys 
85 90 95 

Val Asn Arg Ala He Ser Asn Asp Ala Leu Asp Ser ser Thr Pro Gly 
100 105 110 

Ser Glu Gly ser ser Pro Asp Ala Gin Glu Asp val Thr Gly Asp ser 
115 120 125 

Leu Pro Lys Ser Gin Asn Asp Asp Arg Glu val Gly Arg Glu lie lie 
130 135 140 

Thr val Lys Pro Thr Pro Arg Met His Pro Val Lys Arg Ser Thr Ser 
145 150 155 160 

Ser Gly Glu Thr Ser Ser Gly Leu Asp Ala Asp Gly His Phe Lys Pro 
165 170 1 7 5 
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Ser Pro Gin Pro Arg ser Met Leu Lys Lys ser Ser His Thr Glu Glu 
180 185 190 

Gly val Arg Pro Gly val Asp Lys Glu His ser lie ser Glu Ala Ser 
195 200 205 

Ala Pro Thr Pro ser Leu Pro Arg Gin Asn Gly Thr Glu Leu Gin Thr 
210 215 220 

Glu Glu Lys lie Tyr Ser Glu Asn Leu Asp Leu Glu Asp ser Leu Leu 
225 230 235 240 

Gin Ser Leu Thr ser Ser ser Phe Lys Glu Ser Pro Gly Gly cys Thr 
245 250 255 

ser Pro Gly ser Gin Glu Lys Val Pro lie Lys Asp His Asp Gly Glu 
260 265 270 

Pro Thr Glu lie Trp Asp ser Leu Leu Ser Asn Glu Asn Glu Gly Ser 
275 280 285 

ser Val Leu val Asn cys val Thr Pro Glu Leu Glu Gin Pro Lys Asp 
290 295 300 

Gly Gin val Ala Ala Asp Asp Leu Glu Glu Glu Arg Glu Lys Gly Gly 
305 310 315 320 

Phe Thr Glu Asp Asp Leu Thr Thr Asp Pro Leu Leu Ser Thr Ser Pro 
325 330 335 

Ser val lie Thr Pro Thr Glu Pro Ala Glu Pro Ala Lys Lys Ala Asn 
340 345 350 

Glu Asp Arg Asn Thr Lys Asn Lys Lys Thr Thr Asn Asn Arg Val Ser 
355 360 365 

Ser Ala Ser Gly Ser Arg Leu Met Thr Ser Glu Phe Leu Lys Arg Ser 
370 375 380 

Gly Pro Thr Lys Arg Ser Pro ser Ala Ala Thr ser Ser His Tyr Leu 
385 390 395 400 

Gly Ser Leu Lys Val Leu Asp Gin Lys Gin Pro Arg Lys Gin ser Leu 
405 410 415 

Glu Pro Asp Lys Ala Asp His lie Arg Ala Ala val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 
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He Glu ser Glu Asn Leu Arg He Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lvs Arq Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met Lys 
465 470 475 480 

Glu Lys Glu Ala Lys Arg lie Ala Ala Lys Lys Arg Leu Glu Glu Lys 
485 490 495 

Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Met Arg Lys Gly Glu Ala 
500 505 510 

Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Leu Glu Tyr Leu Lys 
515 520 525 

Glu Lys Thr Arg Arg Glu Lys Glu Tyr Glu Arg Ala Lys Lys Gin Lys 
530 " 535 540 

Glu Glu Glu Ala val Ala Glu Lys Lys Lys Asp ser Leu Thr Ala Phe 
545 550 555 560 

Glu Lys Trp Ser Glu Arg Lys Glu Ala Leu Leu Lys Gin Lys Glu Lys 
565 ~ 570 575 

Glu Lys lie Asn Glu Arg Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys 
580 585 590 

Lys Asp Lys Asp Lys Gin Ala lie Ser Glu Tyr Glu Lys Trp Leu Glu 
595 600 605 

Lys Lys Glu Arg Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg His 
610 615 .620 

Ser Phe Leu Glu Ser Glu Thr His Pro Pro Trp Ser Pro Pro Ser Arg 
625 630 635 640 

Thr Ala Pro ser Lys val Phe 
645 

<210> 47 
<211> 647 
<212> PRT 

<213> artificial sequence 



<400> 47 



Met ser Asp Glu He Phe ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
1 K 5 10 15 
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Lys Ala Thr Lys Arg Thr Ser Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg ser ser Glu Tyr ser Asp Asp Phe 
35 " 40 45 

Asp ser Asp Glu lie Val Ser Leu Gly Glu Phe Ser Asp Thr Ser Thr 
50 55 60 

Asp Glu ser Leu val Arg Lys Lys Met Asn Asp Phe His lie ser Asp 
65 70 75 80 

asp Glu Glu Lys Asn Ser Pro Arg Leu ser Phe Leu Lys Thr Lys Lys 
85 90 95 

Val Asn Arg Ala lie ser Asn Asp Ala Leu Asp Ser Ser Thr Pro Gly 
100 105 110 

Ser Glu Gly Ser Ser Pro Asp Ala Gin Glu Asp Val Thr Gly Asp Ser 
115 120 125 

Leu Pro Lys Ser Gin Asn Asp Asp Arg Glu val Gly Arg Glu lie lie 
130 135 140 

Thr Val Lys Pro Thr Pro Arg Met His Pro val Lys Arg Ser Thr ser 
145 150 155 160 

ser Gly Glu Thr Ser ser Gly Leu Asp Ala Asp Gly His Phe Lys Pro 
165 170 175 

Ser Pro Gin Pro Arg Ser Met Leu Lys Lys Ser Ser His Thr Glu Glu 
180 185 190 

Gly val Arg Pro Gly val Asp Lys Glu His Ser He ser Glu Ala ser 
195 200 205 

Ala Pro Thr Pro Ser Leu Pro Arg Gin Asn Gly Thr Glu Leu Gin Thr 
210 215 ^ 220 

Glu Glu Lys lie Tyr ser Glu Asn Leu Asp Leu Glu Asp Ser Leu Leu 
225 230 235 240 

Gin ser Leu Thr Ser ser Ser Phe Lys Glu Ser Pro Gly Gly Cys Thr 
245 250 255 



Ser Pro Gly Ser Gin Glu Lys val Pro lie Lys Asp His Asp Gly Glu 

260 265 270 

Pro Thr Glu lie Trp Asp Ser Leu Leu Ser Asn Glu Asn Glu Gly ser 
275 280 285 
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ser val Leu val Asn Cys val Thr Pro Glu Leu Glu Gin Pro Lys Asp 
290 295 300 

Gly Gin Val Ala Ala Asp Asp Leu Glu Glu Glu Arg Glu Lys Gly Gly 
305 310 315 320 

Phe Thr Glu Asp Asp Leu Thr Thr Asp Pro Leu Leu Ser Thr Ser Pro 
325 330 335 

Ser val lie Thr Pro Thr Glu Pro Ala Glu Pro Ala Lys Lys Ala Asn 
340 345 350 

Glu Asp Arg Asn Thr Lys Asn Lys Lys Thr Thr Asn Asn Arg val Ser 
355 360 365 

Ser Ala Ser Gly Ser Arg Leu Met Thr Ser Glu Phe Leu Lys Arg Ser 
370 375 380 

Gly Pro Thr Lys Arg Ser Pro Ser Ala Ala Thr Ser Ser His Tyr Leu 
385 390 395 400 

Gly Ser Leu Lys val Leu Asp Gin Lys Gin Pro Arg Lys Gin Ser Leu 
405 410 415 

Glu Pro Asp Lys Ala Asp His He Arg Ala Ala Val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 

lie Glu Ser Glu Asn Leu Arg He Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met Lys 
465 470 475 480 

Glu Lys Glu Ala Lys Arg lie Ala Ala Lys Lys Arg Leu Glu Glu Lys 
485 490 495 

Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Met Arg Lys Gly Glu Ala 
500 505 510 

Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Leu Glu Tyr Leu Lys 
515 520 525 

Glu Lys Thr Arg Arg Glu Lys Glu Tyr Glu Arg Ala Lys Lys Gin Lys 
530 535 540 

Glu Glu Glu Ala val Ala Glu Lys Lys Lys Asp Ser Leu Thr Ala Phe 
545 550 555 560 
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Glu Lys Trp ser Glu Arg Lys Glu Ala Leu Leu Lys Gin Lys Glu Lys 

Glu Lys lie Asn Glu Arg Arg Lys Glu Glu Leu Lys Arg Ala Glu Lys 
580 585 590 

Lys Asp Lys Asp Lys Gin Ala lie Ser Glu Tyr Glu Lys Trp Leu Glu 
y 595 600 605 

Lys Lys Glu Arg Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg His 
610 615 620 

ser Phe Leu Glu ser Glu Thr His Pro Pro Trp ser Pro Pro Ser Arg 
625 630 635 640 

Thr Ala Pro Ser Lys val Phe 
645 

<210> 48 
<211> 344 
<212> PRT 

<213> artificial sequence 



<220> 

<223> hASAP peptide mutant 411-647 
<400> 48 

Glu ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala 
1 5 10 15 

Glu Leu lie Met Asp Asp Asp Arg Thr val Asp Pro Leu Leu ser Lys 
20 25 30 

Ser Gin Ser lie Leu lie Ser Thr ser Ala Thr Ala ser Ser Lys Lys 
35 40 45 

Thr He Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn Arg 
50 55 60 

Ala ser Ser Ala ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys 
65 70 75 80 

Ser ser Ser Lys Arg Arg Thr Pro Ser Thr Thr Thr Ser Ser His Tyr 
85 90 95 

Leu Gly Thr Leu Lys val Leu Asp Gin Lys Pro Ser Gin Lys Gin Ser 
100 105 110 
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He Glu Pro Asp Arg Ala Asp Asn lie Arg Ala Ala val Tyr Gin Glu 
115 120 125 

Trp Leu Glu Lys Lys Asn val Tyr Leu His Glu Met His Arg lie Lys 
130 135 140 

Arg lie Glu ser Glu Asn Leu Arg lie Gin Asn Glu Gin Lys Lys Ala 
145 150 155 160 

Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys Ala Met 
165 170 175 

Lys Glu Lys Glu Ala Lys Lys lie Ala Ala Lys Lys Arg Leu Glu Glu 

Lvs Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg Lys Gly Glu 
y 195 200 205 

Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu Tyr Leu 
210 215 220 

Lys Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys Lys Gin 
225 230 235 240 

Lys Glu Glu Glu Thr val Ala Glu Lys Lys Lys Asp Asn Leu Thr Ala 
245 250 255 

val Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin Lys Lys 
260 265 270 

Lys Glu Lys lie Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg Ala Glu 
275 280 285 

Lys Lys Asp Lys Asp Lys Gin Ala lie Asn Glu Tyr Glu Lys Trp Leu 
290 295 300 

Glu Asn Lys Glu Lys Gin Glu Arg lie Glu Arg Lys Gin Lys Lys Arg 
305 310 315 320 

His Ser Phe Leu Glu ser Glu Ala Leu Pro Pro Trp ser Pro Pro Ser 
325 330 335 

Arg Thr Val Phe Ala Lys val Phe 
340 

<210> 49 
<211> 237 
<212> PRT 

<213> artificial sequence 
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<220> 

<223> hASAP mutant 411-647 
<400> 49 

Ser Gin Lys Gin Ser He Glu Pro Asp Arg Ala Asp Asn lie Arg Ala 
15 10 15 

Ala val Tyr Gin Glu Trp Leu Glu Lys Lys Asn Val Tyr Leu His Glu 
20 25 30 

Met His Arg lie Lys Arg lie Glu Ser Glu Asn Leu Arg lie Gin Asn 
35 ~ 40 45 

Glu Gin Lys Lys Ala Ala Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu 
50 55 60 

Ala Trp Lys Ala Met Lys Glu Lys Glu Ala Lys Lys He Ala Ala Lys 
65 70 75 SO 

Lys Arg Leu Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala 
85 90 95 

Ala Arg Lys Gly Glu Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys 
100 105 110 

Lvs Met Glu Tyr Leu Lys Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu 
115 120 125 

Arq Ala Lys Lys Gin Lys Glu Glu Glu Thr val Ala Glu Lys Lys Lys 
130 135 140 

Asp Asn Leu Thr Ala Val Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe 
145 150 155 160 

Phe Lys Gin Lys Lys Lys Glu Lys He Asn Glu Lys Arg Lys Glu Glu 
165 170 175 

Leu Lys Arg Ala Glu Lys Lys Asp Lys Asp Lys Gin Ala lie Asn Glu 
180 185 190 

Tyr Glu Lys Trp Leu Glu Asn Lys Glu Lys Gin Glu Arg lie Glu Arg 
195 200 205 

Lys Gin Lys Lys Arg His ser Phe Leu Glu Ser Glu Ala Leu Pro Pro 
210 215 220 

Trp ser Pro Pro ser Arg Thr Val Phe Ala Lys val Phe 
225 230 235 
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<210> 50 
<211> 170 
<212> PRT 

<213> artificial sequence 



<220> 

<223> hASAP mutant 478-647 
<400> 50 

Ala Met Lys Glu Lys Glu Ala Lys Lys He Ala Ala Lys Lys Arg Leu 
1 5 10 15 

Glu Glu Lys Asn Lys Lys Lys Thr Glu Glu Glu Asn Ala Ala Arg Lys 
20 25 30 

Glv Glu Ala Leu Gin Ala Phe Glu Lys Trp Lys Glu Lys Lys Met Glu 
35 40 45 

Tvr Leu Lys Glu Lys Asn Arg Lys Glu Arg Glu Tyr Glu Arg Ala Lys 
50 55 60 

Lys Gin Lys Glu Glu Glu Thr val Ala Glu Lys Lys Lys Asp Asn Leu 
65 70 75 80 

Thr Ala val Glu Lys Trp Asn Glu Lys Lys Glu Ala Phe Phe Lys Gin 
85 90 95 

Lys Lys Lys Glu Lys lie Asn Glu Lys Arg Lys Glu Glu Leu Lys Arg 
100 105 110 

Ala Glu Lys Lys Asp Lys Asp Lys Gin Ala lie Asn Glu Tyr Glu Lys 
115 120 125 

Trp Leu Glu Asn Lys Glu Lys Gin Glu Arg He Glu Arg Lys Gin Lys 
130 135 140 

lvs Arq His Ser Phe Leu Glu Ser Glu Ala Leu Pro Pro Trp ser Pro 
145 150 155 160 

pro Ser Arg Thr Val Phe Ala Lys Val Phe 
165 170 

<210> 51 
<211> 477 
<212> PRT 

<213> artificial sequence 
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<220> 

<223> hASAP mutant 1-477 
<400> 51 

Met Ser Asp Glu val Phe ser Thr Thr Leu Ala Tyr Thr Lys ser Pro 
15 10 15 

Lys Val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg ser Ala Arg Gin Arg ser Ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp Ser Asp Glu lie Val Ser Leu Gly Asp Phe ser Asp Thr ser Ala 
50 55 60 

Asp Glu Asn Ser Val Asn Lys Lys Met Asn Asp Phe His lie ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro val cys Ala lie Lys Asn 
100 105 110 

Glu Glu Glu Met Ala Pro Asp Gly cys Glu Asp lie val val Lys ser 
115 120 125 

Phe Ser Glu ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie 
130 135 140 

Lys Met Lys Pro Lys Pro Arg lie Leu Ser lie Lys Ser Thr Ser ser 
145 150 155 160 

Ala Glu Asn Asn Ser Leu Asp Thr Asp Asp His Phe Lys Pro Ser Pro 
165 170 175 

Trp Pro Arg Ser Met Leu Lys Lys Lys ser His Met Glu Glu Lys Asp 
180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu Ser Glu Glu Leu Glu Leu His 
195 200 205 

Ser Ala Pro Ser ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe Ser Glu Asn Leu Asp Pro Glu Asp ser cys Leu 
225 230 235 240 
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Thr ser Leu Ala Ser Ser Ser Leu Lys Gin lie Leu Gly Asp Ser Phe 
245 250 255 

ser Pro Gly Ser Glu Gly Asn Ala Ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn Ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 

Ser Phe Ser Ala Asp His val Thr Thr Ala Val Glu Lys Ser Lys Glu 
290 295 300 

Ser Gin val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala Glu 
305 310 315 320 

Leu lie Met Asp Asp Asp Arg Thr Val Asp Pro Leu Leu ser Lys ser 
325 330 335 

Gin ser lie Leu lie ser Thr Ser Ala Thr Ala ser ser Lys Lys Thr 
340 345 350 

lie Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn Arg Ala 
355 360 365 

ser Ser Ala ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys Ser 
370 375 380 

Ser ser Lys Arg Arg Thr Pro ser Thr Thr Thr Ser Ser His Tyr Leu 
385 390 395 400 

Gly Thr Leu Lys Val Leu Asp Gin Lys Pro Ser Gin Lys Gin Ser lie 
405 410 415 

Glu Pro Asp Arg Ala Asp Asn lie Arg Ala Ala val Tyr Gin Glu Trp 
420 425 430 

Leu Glu Lys Lys Asn Val Tyr Leu His Glu Met His Arg lie Lys Arg 
435 440 445 

He Glu ser Glu Asn Leu Arg He Gin Asn Glu Gin Lys Lys Ala Ala 
450 455 460 

Lys Arg Glu Glu Ala Leu Ala Ser Phe Glu Ala Trp Lys 
465 470 475 

<210> 52 
<211> 418 
<212> PRT 

<213> artificial sequence 
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<220> 

<223> hASAP mutant 1-418 
<400> 52 

Met ser Asp Glu Val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
15 10 15 

Lys Val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg ser ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp Ser Asp Glu lie val ser Leu Gly Asp Phe ser Asp Thr Ser Ala 
50 55 60 

Asp Glu Asn Ser Val Asn Lys Lys Met Asn Asp Phe His lie Ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro val cys Ala lie Lys Asn 
100 105 110 

Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp lie val val Lys Ser 
115 120 125 

Phe Ser Glu Ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys He 
130 135 140 

Lys Met Lys Pro Lys Pro Arg He Leu ser lie Lys ser Thr ser ser 
145 150 155 160 

Ala Glu Asn Asn ser Leu Asp Thr Asp Asp His Phe Lys Pro ser Pro 
165 170 175 

Trp Pro Arg Ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu Ser Glu Glu Leu Glu Leu His 
195 200 205 

ser Ala Pro ser Ser Leu Pro Thr Pro Asn Gly lie Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe Ser Glu Asn Leu Asp Pro Glu Asp ser cys Leu 
225 230 235 240 
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Thr ser Leu Ala ser Ser Ser Leu Lys Gin lie Leu Gly Asp ser Phe 
245 250 255 

Ser Pro Gly Ser Glu Gly Asn Ala ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 

ser Phe ser Ala Asp His Val Thr Thr Ala val Glu Lys Ser Lys Glu 
290 295 300 

Ser Gin Val Thr Ala Asp Asp Leu Glu Glu Glu Lys Ala Lys Ala Glu 
305 310 315 320 

Leu lie Met Asp Asp Asp Arg Thr Val Asp Pro Leu Leu Ser Lys ser 
325 330 335 

Gin Ser lie Leu lie Ser Thr Ser Ala Thr Ala Ser Ser Lys Lys Thr 
340 345 350 

lie Glu Asp Arg Asn lie Lys Asn Lys Lys Ser Thr Asn Asn Arg Ala 
355 360 365 

ser Ser Ala Ser Ala Arg Leu Met Thr Ser Glu Phe Leu Lys Lys Ser 
370 375 380 

Ser Ser Lys Arg Arg Thr Pro Ser Thr Thr Thr ser Ser His Tyr Leu 
385 390 395 400 

Gly Thr Leu Lys Val Leu Asp Gin Lys Pro Ser Gin Lys Gin Ser lie 
405 410 415 

Glu Pro 



<210> 53 
<211> 303 
<212> PRT 

<213> artificial sequence 
<220> 

<223> hASAP mutant 1-303 
<400> 53 

Met Ser Asp Glu val Phe Ser Thr Thr Leu Ala Tyr Thr Lys Ser Pro 
15 10 15 
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Lys val Thr Lys Arg Thr Thr Phe Gin Asp Glu Leu lie Arg Ala lie 
20 25 30 

Thr Ala Arg Ser Ala Arg Gin Arg ser ser Glu Tyr Ser Asp Asp Phe 
35 40 45 

Asp ser Asp Glu lie val ser Leu Gly Asp Phe Ser Asp Thr ser Ala 
50 55 60 

Asp Glu Asn Ser val Asn Lys Lys Met Asn Asp Phe His lie ser Asp 
65 70 75 80 

Asp Glu Glu Lys Asn Pro Ser Lys Leu Leu Phe Leu Lys Thr Asn Lys 
85 90 95 

Ser Asn Gly Asn lie Thr Lys Asp Glu Pro Val Cys Ala lie Lys Asn 
100 105 110 

Glu Glu Glu Met Ala Pro Asp Gly Cys Glu Asp lie val Val Lys ser 
115 120 125 

Phe Ser Glu Ser Gin Asn Lys Asp Glu Glu Phe Glu Lys Asp Lys lie 
130 135 140 

Lys Met Lys Pro Lys Pro Arg He Leu ser lie Lys Ser Thr ser Ser 
145 150 155 160 

Ala Glu Asn Asn ser Leu Asp Thr Asp Asp His Phe Lys Pro ser Pro 
165 170 175 

Trp Pro Arg Ser Met Leu Lys Lys Lys Ser His Met Glu Glu Lys Asp 
180 185 190 

Gly Leu Glu Asp Lys Glu Thr Ala Leu Ser Glu Glu Leu Glu Leu His 
195 200 205 

Ser Ala Pro Ser Ser Leu Pro Thr Pro Asn Gly He Gin Leu Glu Ala 
210 215 220 

Glu Lys Lys Ala Phe ser Glu Asn Leu Asp Pro Glu Asp Ser cys Leu 
225 230 235 240 

Thr ser Leu Ala ser ser Ser Leu Lys Gin lie Leu Gly Asp ser Phe 
245 250 255 

Ser Pro Gly Ser Glu Gly Asn Ala ser Gly Lys Asp Pro Asn Glu Glu 
260 265 270 

lie Thr Glu Asn His Asn Ser Leu Lys Ser Asp Glu Asn Lys Glu Asn 
275 280 285 
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ser Phe ser Ala Asp His val Thr Thr Ala val Glu Lys ser Lys 
290 295 300 
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